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本 书 是 当代 国际 最 著名 的 统计 学 家 之 一 C. R. 劳 的 -部 统计 学 哲理 
论著 ,也 是 他 毕生 统计 学 术 思想 的 总 结 , 同 时 还 是 一 本 通俗 的 关于 统计 学 原 
理 的 普及 教科 书 . 

书 中 .作者 从 哲学 的 角度 论述 了 统计 学 原理 ,通过 实例 ,不 仅 证 明了 统 
计 学 是 一 门 最 严格 ` 最 合理 的 认识 论 和 方法 学 ,还 深刻 地 揭示 了 现代 统计 学 
发 展 的 过 程 ,特别 是 那些 很 深刻 的 理论 是 如 何 从 - 些 非常 简单 实际 的 问题 
中 发 展 起 来 的 . 本 书 前 5 章 讲述 了 统计 学 从 最 初 收集 .汇编 数据 为 行政 管理 
服务 ,发 展 成 为 有 一 整套 原理 和 研究 方法 的 独立 学 科 的 历史 ,第 6 章 谈 及 了 
普通 公众 对 统计 学 的 理解 , 蝇 调 了 从 数字 中 学 习 有 助 于 成 为 有 效率 的 公民 、 
本 8 最 引 人 注 目的 特点 是 , 书 中 提 到 的 所 有 科学 的 学 科 调 查 与 决策 和 统计 
之 间 的 关联 是 由 一 系列 实例 来 说 明 的 ,本 书 使 用 非 专 业 语言 通俗 地 阐述 了 
统计 学 的 基本 概念 和 方法 .适合 大 众 读 者 . 
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本 书 谨 献 给 
引导 我 探求 知识 的 
s 
A. Laxmikanthamma 


在 我 年 少时 ,母亲 每 天 早上 四 点 起 床 ,为 我 点 上 油灯 ， 
使 我 能 在 安静 的 早晨 精力 充沛 地 用 功 读 书 


知识 是 我 们 已 知 的 
也 是 我 们 未 知 的 
基于 已 有 知识 之 上 
我 们 去 发 现 未 知 的 


由 此 ,知识 得 到 扩充 


我 们 获得 的 知识 越 多 
未 知 的 知识 就 会 更 多 


因而 ,知识 的 扩充 永 无 止境 
RRR 
在 终极 的 分 析 中 , 一切 知识 都 是 历史 
在 抽象 的 意义 下 ,一 切 科 学 都 是 数学 
在 理性 的 基础 上 ,所 有 的 判断 都 是 统计 学 


中 文 版 出 版 说 明 


我 很 高 兴 看 到 《统计 与 真理 一 一 怎样 运用 偶然 性 》 一 书 走 进 中 国 . 我 要 感谢 李 
HARE , 石 坚 博士 和 白 志 东 教 授 ,因为 我 的 书稿 是 英文 的 ,为 了 把 本 书 奉 献 给 中 
读者 ,他 们 对 书稿 的 翻译 做 了 大 量 的 工作 

如 何 建立 新 知识 ?这 个 问题 取决 于 我 们 对 知识 概念 的 认 知 .以 一 个 背 学 家 的 
观点 ,知识 存在 于 (真实 的 或 确定 的 ) 诬 误 之 中 ,推理 是 获得 这 样 的 知识 的 工具 .而 
从 一 个 科学 家 的 观点 来 看 ,一切 知识 都 不 是 绝对 正确 的 .通过 任何 方式 所 得 到 的 一 
个 科学 理论 知识 ,如 果 能 引导 出 可 接受 限度 内 的 预示 ,就 能 获得 认可 , 一 个 新 的 理 
论 如 果 能 提供 更 好 的 预示 ,就 将 取代 已 经 存在 的 科学 理论 .而 从 绕 计 学 的 角度 来 
看 ,从 经 验 或 实验 中 获取 的 知识 是 不 确定 的 ,但 在 实际 生活 中 ,不 管 这 些 已 有 的 知 
识 如 何 贫乏 ,我 们 不 得 不 以 此 做 出 决策 .统计 学 关注 的 是 如 何 探知 由 观察 数据 获取 
的 知识 中 的 不 确定 性 的 基 度 ,以 及 如 何 明确 在 最 小 损失 下 的 最 优 决策 . 

《统计 与 真理 一 一 怎样 运用 侦 然 性 》 讨 论 的 问题 是 :如 何 设计 实验 以 便 提 供 所 
要 求 的 信息 ,如 何 从 实验 结果 中 获取 一 切 有 效 信 息 ,以 及 如 何在 实际 中 应 用 这 些 信 
息 - 本 书 将 通过 大 量 的 事例 来 讨论 这 祥 一 个 过 程 中 的 藻 理 .逻辑 和 实践 的 问题 ,以 
及 如 何 避 免 对 统计 方法 的 误 用 或 对 统计 学 的 误解 的 问题 

人 类 - 切 努 力 的 最 终 目 的 是 寻求 真理 ,而 在 严格 意义 下 的 真理 是 不 可 得 到 的 ， 
替代 的 是 要 寻求 可 接受 的 知识 .严格 地 讲 ,知识 不 是 真理 ,但 它 应 最 好 地 运用 真理 . 

我 们 应 该 记 住 中 国 大 哲学 家 孔子 所 说 的 :知之 为 知之 ,不 知 为 不 知 ,是 知 也 . 

最 后 ,我 要 感谢 科学 出 版 社 在 本 书 的 出 版 过 程 中 的 合作 和 努力 













































































C R F 
袜 乡 法 尼 亚 州 州立 大 学 大 学 城 
2003 年 7 月 28 日 


不 确定 性 知识 
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所 含 不 确定 性 量度 的 知识 


可 用 的 知识 
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《统计 与 真理 一 一 怎样 运用 偶然 性 ) 一 书 的 英文 版 ,是 在 1987 e&t pre 
的 百年 诞辰 活动 期 间 .我 所 作 的 三 次 关于 统计 学 历史 与 发 展 的 演讲 的 基础 上 完成 
的 .演讲 中 所 涉及 的 每 一 个 主题 都 更 详细 地 重新 写 过 ,各 自 独立 成 章 . 现在 的 中 文 
版 在 许多 方面 与 英文 版 有 明显 的 不 同 . 

英文 版 中 的 第 一 、 第 二 和 第 三 讲 的 内 容 现 在 完全 被 重新 组 织 ,并 扩展 成 为 系列 
的 S 个 章节 ,回顾 了 统计 学 从 最 初 收 集 .汇编 数据 为 行政 管理 服务 ,发 展 成 为 有 一 
整套 原理 和 研究 方法 的 独立 学 科 的 历史 , 书 中 提 到 的 所 有 科学 学 科 的 调查 与 决策 
和 统计 学 之 间 的 关联 由 一 系列 实例 来 说 明 , 最 后 一 章 , 基 第 6 章 是 新 增加 的 , 谈 及 
普通 公众 对 统计 学 的 理解 ,也 是 大 家 感 兴趣 的 话题 . 

第 1 章 所 涉及 的 随机 性 、 混 沌 与 偶然 性 这 些 概 念 在 调查 和 解释 自然 现象 中 扮 
演 着 重要 的 角色 ,强调 了 随机 数 在 秘密 通讯 .产生 无 偏差 信息 以 及 在 解决 复杂 计算 
中 的 重要 性 .也 谈 到 了 与 艺术 和 科学 中 的 创造 性 有 关 的 一 些 想法 .第 2 章 介 绍 了 在 
新 知识 建立 中 常用 到 的 妇 纳 法 与 演绎 法 . 同时 也 说 明 如 何 量度 不 确定 性 使 人 们 能 
获得 最 佳 决策 . 

统计 学 思想 远古 即 存 , 但 作为 -i ] 学 科 历 史 却 不 长 .第 3 章 和 第 4 章 从 原始 
人 用 肇 痕 记 数 来 记录 他 的 性 畜 的 数量 开始 ,到 从 数字 或 者 已 知 数据 中 抽取 信息 ,成 
为 在 不 确定 性 条 件 下 做 出 推 斯 的 一 种 强 有 力 的 逻辑 工具 方面 ,来 讲述 统计 学 发 展 
的 历史 .也 强调 了 避免 钓 造 数据 ,污染 数据 或 任意 对 数据 进行 编 繁 的 重要 性 ,同时 
介绍 了 如 何 检测 数据 中 存在 这 一 类 问题 的 一 些 方法 .第 5 章 用 来 讲述 统计 学 的 无 
处 不 在 ,无 论 在 解 开 自然 奥秘 的 科学 调查 中 ,或 是 要 在 日 常生 活 中 做 出 最 佳 决策 ， 
或 者 要 解决 法 庭 争端 时 ,统计 学 都 是 一 种 探求 真理 的 必 不 可 少 的 工具 ， 

我 们 都 生活 在 信息 时 代 ,大 多 数 的 信息 都 是 以 量化 的 形式 传播 的 例如 :今年 
的 犯罪 率 与 前 -~ 年 相 比 下 降 了 10% ;明天 有 30% 的 可 能 要 下 雨 ;股票 市 场 的 道 - 琼 
斯 指数 价格 增加 了 50 点 ;世界 上 每 4 个 新 生 册 儿 中 有 一 个 是 中 国人 ; 竟 成 总 统 的 
外 交 政 策 的 人 数 占 总 人 数 的 57%. 这 个 估计 的 误差 不 会 超过 4 个 妆 分 点 ;如 果 你 
坚持 独身 ,你 的 寿命 要 减少 8 年 .所 有 这 些 数字 对 一 般 公 众 来 说 到 底 意 味 着 什么 
R? 这 些 数字 里 面包 含 什么 样 的 信息 会 有 助 于 个 人 做 出 正确 决策 去 改进 提高 他 们 
的 生活 质量 呢 ? 强调 公众 对 统计 学 理解 的 需要 是 我 们 在 本 版 新 加 的 第 6 章 里 所 作 
的 一 个 尝试 .能 从 数字 中 学 习 有 助 于 成 为 有 效率 的 公民 ,正如 囊 尔 斯 (H.G. Wells) 
所 强调 的 : 
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统计 思维 总 有 一 天 会 像 读 与 写 一 样 成 为 一 个 有 效率 公民 的 必 备 能 力 . 
1987 年 ,在 每 次 演讲 的 开始 ,我 都 要 提 到 拉 曼 纽 扬 的 生活 和 工作 .我 将 所 有 这 
些 传 记性 的 细节 作为 一 个 与 拉 曼 纽 扬 生平 有 关 的 文献 放 在 了 本 书 末 的 附录 里 . 
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译 Pp GE 


É 1992 年 11 月 我 国 国家 技术 监督 局 颁布 的 GBAT14745-92《 学 科 分 类 与 代 
码 ) 中 ,将 统计 学 与 数学 ,经济 学 等 学 科 并 列 上 升 为 一 级 学 科 ,把 包括 原 局 社会 科学 
领域 和 自然 科学 领域 的 各 种 统计 学 归并 为 一 门 统计 学 以 来 ,统计 学 学 科 的 发 展 和 
统计 学 教育 就 以 一 个 新 的 面貌 在 我 国 出 现 了 .在 我 国 ,由 于 长 期 受 原 苏 联 统 计 学 教 
学 思想 的 影响 ,理科 将 统计 学 视 为 一 门 数学 专业 ,文科 方面 仅 注 重 宏观 统计 描述 ， 
没有 充分 重视 统计 学 科学 性 的 研究 ,没有 充分 重视 统计 分 析 和 数据 计算 分 析 对 解 
决 实际 问题 的 潜在 功能 ,使 我 国 统计 专业 的 发 展 一 方面 长 期 偏向 数学 理论 ,忽视 统 
计 分 析 本 身 与 多 科学 交叉 发 展 的 内 潘 ; 另 一 方面 带 有 较 强 的 计划 经 济 下 的 定性 分 
PAE ,失去 了 以 数据 来 解释 现象 的 统计 学 的 本 质 . 近 十 几 年 以 来 ,我 国 逐步 大 力 
开展 统计 分 析 的 实际 应 用 ,开始 注重 统计 学 与 其 他 科学 交叉 发 展 的 理论 与 应 用 研 
究 . 企 与 国际 水 平 相 比 ,在 利用 现代 统计 学 的 理论 .方法 和 计算 功能 来 解决 自然 科 
学 .社会 科学 中 的 实际 问题 方面 ,我 们 还 有 相当 的 距离 ;交叉 学 科 的 发 展 ,如 生物 统 
计 .金融 统 计 .经 济 统计 等 方面 ,我 们 还 没有 形成 较 强 的 研究 实力 .一 般 公 众 对 统计 
学 的 认识 还 有 待 进一步 提高 . 

本 书 是 统计 学 界 最 知名 的 权威 之 一 CR. 劳 的 著作 ,是 他 毕生 经 验 的 总 结 , 既 
是 一 本 高 深 的 统计 学 哲理 的 专著 ,又 是 一 本 通俗 的 统计 学 原理 的 普及 教科 书 . (本 
书 跋 的 作者 白 志 东 先生 已 对 C.R. 劳 先生 毕生 对 统计 学 的 贡献 及 本 书 的 内 容 作 了 
较 详细 的 介绍 ,这 里 不 再 痪 述 , ) 自 英文 版 问世 以 来 ,在 世界 各 地 广泛 流传 ,并 先后 
出 版 了 日 文 .西班牙 文 ,波兰 文 、 德 文 和 中 文 繁体 字 版 等 . 我 们 和 本 书 作 者 C.R. 劳 
先生 商量 出 版 中 文 简体 字 版 ,他 欣然 同意 ,并 委托 我 们 做 中 文 简体 字 版 的 翻译 和 出 
版 工作 .相信 本 书 中 文 简体 字 版 的 出 版 将 对 我 国学 生 学 习 统 计 学 知识 有 一 定 的 帮 
Bh. 































































































在 准备 中 文 简体 字 版 期 间 ,欣喜 得 知 C. R. 劳 先 生 荣获 2002 年 度 美 国 总 统 科 
学 奖 ,并 于 2002 年 6 月 12 日 在 白宫 接受 了 布什 总 统 的 颁奖 ,表彰 他 在 “统计 学 理 
论 的 建立 ,多 元 统计 分 析 方 法 及 其 应 用 方面 所 做 的 开拓 性 贡献 ,其 丰富 了 物理 学 、 
生物 学 ,数学 .经 济 学 和 工程 学 的 发 展 "我 们 说 以 中 文 简体 字 版 的 正式 出 版 作为 我 
们 对 先生 获奖 的 衷心 祝贺 ,并 庆贺 先生 83 P ERE. 

RE PSE RT BITE (David Cox Sir) 评 论 本 书 原文 时 曾 谈 到 “ 书 中 论题 涉及 了 从 
创造 性 本 质 这 样 一 些 一 般 哲 学 概念 到 专业 统计 学 原理 ,是 一 本 阐述 统计 学 论点 本 
质 的 力作 ”. 尽 管 我 们 力求 准确 把 握 原文 内 容 , 但 由 于 学 力 有 限 ,专业 和 文字 能 力 则 
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译 者 的 话 





有 未 录 , 译 文中 定 会 存在 词 不 达意 甚至 误 译 的 地 方 , 诚 县 专家 、 学 者 和 广大 演 者 的 
批评 指正 ,另外 ,我 们 在 翻译 的 过 程 中 ,专业 人 名 主要 参考 了 《英汉 数学 词汇 》( 科 学 





出 版 社 ),《 英 汉 统 计 学 词汇 《中 

















统计 出 版 社 ),《 英 俄 汉 数学 词汇 (广东 科技 出 版 


社 ). 个 别 找 不 到 译 法 的 ,没有 译 上 出 ， 
我 们 感谢 C. R. 劳 先 生 和 科学 出 版 社 给 我 们 这 个 机 会 ,感谢 白 志 东 先生 专门 
为 本 简体 字 版 作 丰 ,同时 ,感谢 鲁 万 波 、 衬 方 文 在 本 书 文字 编辑 方面 给 予 的 大 力 


支持 . 


译 者 
川 大 花园 ,成 都 
2002 年 12 月 
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但 如 同一 境 石 头 并 不 是 一 栋 房 于 ,仅仅 是 事实 的 收集 ,也 并 不 
成 为 一 门 科 学 。 


J.H. Poincare 


对 统计 学 的 一 知 半 解 常 常 造成 不 必要 的 上 当 受 骗 
对 统计 学 的 一 概 排斥 往往 造成 不 必要 的 天 昧 无 知 
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第 1 章 不 确定 性 .随机 性 与 新 知识 的 创立 


让 混沌 涌 来 吧 ! 
让 云彩 形成 一 片 沼泽 ! 
我 等 待 着 成 形 . 
BH Y EU (Robert Frost) 


11 不 确定 性 及 其 度量 化 


不 确定 性 与 随机 性 的 概念 已 经 困扰 人 类 很 长 一 段 时 间 了 .在 我 们 生活 的 物质 
世界 和 社会 环境 中 , 我 们 无 时 无 刻 不 面 对 不 确定 性 ,外 受 各 种 自然 灾祸 , 忍受 着 
大 自然 的 不 确定 性 , 正 像 歌 德 所 想像 的 那样 ,事物 是 具有 不 确定 性 的 : 

伟大 的 ,内 在 的 永恒 不 变 的 法 则 能 给 我 们 指出 使 我 们 不 再 徘徊 的 路 

吗 ? 

或 者 是 像 近 三 个 丝 纪 以 来 ,也 可 以 说 是 从 古 至 今 最 伟大 的 物理 学 家 爱 因 斯 地 所 相 
信 的 那样 : 

上 帝 决 不 会 和 宇宙 赌博 . 
某 些 神学 家 认为 : ROS SEO fib] JJ 5, 对 上 带 来 说 没有 什么 是 随机 性 的 .但 
也 有 人 断言 :即使 是 上 帝 , 也 被 茜 些 随机 现象 所 左右 , 弗 朗 斯 (A、France) 在 他 所 著 
BS (Dro KB (The Garden of Epicurus)- -35 72358): 


HAMM, UAE SE AUR IBXGR RC HERE I 13 6 








e. 


从 亚 里 士 多 德 时 代 开 始 , 哲学 家 们 就 已 经 认识 到 随机 性 在 生活 中 的 作用 , 他 们 把 
随机 性 看 做 破坏 秩序 规律 和 超越 人 们 理解 能 力 范围 的 东西 ,但 没有 认识 到 有 可 能 
去 研究 更 机 性 ,或 者 是 去 测量 不 确定 性 .印度 的 哲学 家 们 信奉 古 印 度 的 因果 报应 
学 说 , 认为 没有 必要 二 研究 随机 性 ,内 为 按 其 严格 的 因果 关系 教规 解释 : 一 个 人 
的 命运 , 是 由 人 的 前 进 的 行动 所 决定 的 . 

所 有 人 类 的 活动 都 是 基于 某 种 预 水 的 , WAS, 找 工 作 , 结婚 或 投资 . 既然 
木 来 是 不 可 预测 的 ,不 管 人 们 掌握 多 少 信息 ,都 不 可 能 存在 能 做 出 正确 决策 的 系统 
方法 .做 出 决策 时 ,为 了 避免 不 确定 情况 和 防止 产生 错误 ， 人 们 依赖 于 像 占 星 术 
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MERWE, SPRAIN AULT, 甚至 于 做 了 迷信 和 下 不 的 牺 犊 品 . 人 类 至 今 仍 
相信 这 样 的 古训 : 

这 是 一 个 普遍 真理 : 每 一 个 人 应 该 对 重要 机 遇 保 持 租 锐 的 眼光 . 
普 洛 塔 斯 {(Plautius, 公元 前 200 4) 
这 个 十 洲 至 今 仍 有 影响 , 变 为 今 大 的 说 法 就 是 ; 
一 次 机 会 也 许可 弥补 由 于 错失 良机 所 造成 的 损失 . 
Pb RE dI (Roben Southwell, 1980) 
-个 人 的 成 功 或 失败 ， 与 其 说 是 用 能 力 或 努力 , 不 如 说 是 用 机 遇 来 解释 更 合 
适 .在 任何 给 定 的 情况 下 , 都 有 吓 能 产 牛 不 确定 性 .主要 由 于 下 列 的 原因 : 
* ”缺乏 信息 ; 
% ”所 得 信息 小 ,本 被 认识 证 的 不 准确 性 ; 
* ”缺乏 一 定 的 技术 手段 去 收集 所 需 的 信息 ; 
# “不 可 能 进行 某 些 必 归 的 测量 ; 














如 同 物理 学 中 基本 粒子 的 运动 .生物 学 中 笨 传 因子 和 染色 体 的 游离 不 定 以 及 
在 社会 中 处 于 紧张 状态 下 的 人 们 的 行为 等 一 样 , 自然 办 中 的 不 确定 性 是 固有 的 . 
这 些 与 其 说 是 基于 决定 论 的 法 则 ,不 如 说 是 基于 随机 论 法 则 的 不 确定 性 现象 , 已 
经 成 为 自然 科学 .生物 科学 和 社会 科学 理论 发 展 的 必要 基础 . 

那么 , 人 类 在 不 确定 性 下 ， 如 何 做 出 决定 呢 ? 我 们 如 何 对 某 些 特定 的 观察 数 
据 加 以 概括 总 结 来 发 现 新 的 现象 或 提出 新 的 理论 呢 ? 这 个 过 程 涉及 到 艺术 BOR 
还 是 科学 呢 ? 

直到 20 址 纪 初 叶 才 并 始 将 不 确定 性 数量 化 来 尝试 回答 这 些 问题 ,我 们 还 不 能 
说 这 个 努力 已 经 {分 成 功 了 ,但 就 是 那些 已 经 取得 的 成 灯 , 已 经 给 人 类 活动 的 一 
DIU fo “ 场 革 命 .这 场 革命 已 经 给 予 人 类 新 的 研究 设想 , 促进 了 自然 科学 
知识 的 发 展 并 繁荣 了 人 类 生活 .同时 也 改变 了 我 们 的 思考 方法 , 使 我 们 能 大 胆 去 
探索 自然 的 奥秘 , 而 以 前 由 于 我 们 被 禁 钢 于 宿命 论 的 观点 之 中 以 及 处 环 随 机 性 的 
技术 能 力 不 足 , 阻碍 了 我 们 去 进行 这 些 探索 . 

至 于 这 些 发 展 状况 以 及 处 理 随 机 性 的 构想 为 什么 经 历 了 这 么 长 的 时 间 才 出 现 
的 种 种 原因 ,我 们 将 在 下 一 章 中 详细 叙述 . 


1.2 随机 性 与 随机 数 


十 分 奇妙 的 是 , 研究 不 确定 性 的 方法 常常 使 用 随机 排列 的 数 询 .假定 -个 IT 
REPRAK 0,1,2,…,9 的 硬币 ,我 们 一 个 一 个 地 到 出 硬币 并 记录 下 拙 取 硬币 的 
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数字 .每 一 次 抽取 后 , 上 青 把 硬币 放 回 中 和 袋 中 并 充分 混合 ， 然 后 抽取 下 一 个 , 这样 得 
到 的 数列 称 为 随机 数列 .这 时 即便 给 出 前 面 所 抽出 的 “系列 数字 , 也 无 法 得 到 任 
何 咎 示 去 推测 下 次 抽取 的 结果 , 随 届 数列 如 示 了 晤 大 限度 的 不 确定 性 (或 称 为 混沌 
SH) .下 面 我 们 将 看 到 如 何 产 自 随 机 数列 ,并 日 在 进行 某 些 调 查 和 解决 某 些 复 
条 计算 的 问题 中 , 随 般 数 是 如 何不 可 或 缺 的 . 


1.2.1 随机 数 的 书 


1927 年 , 英国 统计 学 家 蒂 皮 特 (Tippett) 开 版 了 一 本 题 为 《随机 抽样 数 ) 的 书 . 
这 本 书 的 内 容 是 41 600 个 数字 (从 0 到 9), 绯 成 4 个 -组 ,每 页 有 数列 , 一共 分 布 
有 26 页 .据说 这 些 数字 是 作者 从 英国 社会 调查 报告 中 所 给 出 的 各 教区 的 面积 的 数 
空中 , 除去 头 尾 的 两 个 数字 , 然后 把 这 些 截 前 过 的 数 一 个 接 一 个 的 混合 排列 起 
来 , 得 到 41 600 个 数字 .这 全书 无 任何 意义 仅 仪 是 杂乱 盛 章 排 生 的 数字 ， 却 在 当 
时 的 专业 书 中 成 了 最 畅销 的 . 继 这 本 书 出 版 后 , 两 位 伟大 的 统计 学 家 ， 费 吹 
(Fisher) 和 耶 芯 (Yates) 出 版 了 另 一 本 随机 数 的 书 , 书 中 共 包 含 15 000 FE UE 
由 20 位 对 数 表 中 排列 第 15~19 位 数组 成 的 . 

随机 数 的 书 ! 完全 光 意 义 、 杂 乱 无 章 收集 的 数字 , 既 无 事实 又 无 放 事 情节 的 
B. 这 种 书 到 底 有 什么 用 呢 ? 为 什么 科学 家 会 对 它们 感 兴趣 呢 ? 这 些 或 许 是 任何 
时 期 的 科学 家 和 门外汉 的 反应 吧 !1 但 尽 随 机 数 的 书 是 20 世纪 中 所 特有 的 创造 , 这 
类 书 是 为 了 解决 现实 出 界 中 各 种 问题 时 对 随 帆 数 的 需 此 而 产生 出 来 的 , 当今 世界 
中 ,大 但 花费 了 数 十 亿美 元 来 从 事 随 机 数 的 生 战 及 相关 的 重要 的 科学 研究 ,以 及 发 
展 高 性 能 高 速度 的 计算 机 . 

什么 是 随机 数列 呢 ? 这 里 不 存在 简单 的 定义 ,如 前 所 述 ,这 里 仅 能 给 出 一 个 模 
糊 的 概念 ， 即 随机 数列 是 不 遵循 任 . -特殊 模式 的 数 重 . 

人 们 如 何 得 到 理想 的 随机 数列 嘱 ? 例如 多 次 投掷 硬币 ,以 0 记 为 反面 , 以 1 
记 为 正面 , 如 同 下 面 这 样 把 数列 记录 下 米 : 

0110310- 

如 果 你 不 是 一 个 能 控制 每 次 投掷 结 果 的 魔术 师 ， 你 则 会 得 到 一 个 称 为 元 (0 或 
1 的 和 随机 数列 .这 样 的 数列 也 可 以 用 如 下 方法 得 到 : 从 装 有 相同 个 数 的 黑 球 和 户 
球 的 口袋 中 一 个 “个 地 取 球 ( 取 后 放 回 )， 记 0 为 收 得 的 黑 球 ,1 为 取得 的 白 球 ,我 
在 折 尔 各 答 印 度 统计 研究 所 给 一 年 级 研究 牛 上 课时 ,经常 让 他 们 去 研究 所 附近 的 
班 - 替 夫 (Bon-Hoophly) 医 院 记录 相继 在 该 医院 出 生 的 婴儿 的 性 别 . 如 果 记 M 为 男 
SB, FAKE, 我们 则 得 到 一 个 如 投掷 厂 币 或 随机 重复 取 球 所 得 到 的 相同 的 二 元 
符号 列 - 这 些 随 机 列 , 一 个 是 生物 学 现象 白 然 产生 的 , 另 一 个 是 人 为 产生 的 . 

RLP, 是 从 一 个 装 有 500 个 下 球 (W) 和 500 个 照 球 (B) 的 口袋 中 取出 并 
放 回 (还 原 抽 样 ), 重复 下 1000 PERN PT RESI II EB BL PUES AR. 表 1.2 是 按 M 为 男 
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BF 为 女 婴 记录 某 医 院 相继 出 生 的 1000 个 婴儿 的 随机 列 . 利用 表 3.18136 1.2 
给 出 的 数据 可 以 归纳 出 它 们 的 频数 分 布 去 . 记 S 个 连续 出 生 的 度 儿 为 一 组 , 以 0， 
1,2,…,5 表 和 下 其 中 男 婴 的 个 数 (如 第 AL EMMEF 中 , BETHA 2). 同样 在 表 
1.1 中 , 记 连 续 抽样 5 次 为 一 组 , 0, 上 ,2,…,5 表示 抽 得 的 白 球 的 个 数 . 胡 1.3 给 
出 了 表 1.1 8D 1.2 中 辣 球 个 数 和 男 婴 人 数 的 频数 分 布 ， 


表 1.1 从 装 有 相同 个 数 的 白 球 和 黑 球 的 口 携 中 相继 抽取 
并 放 回 时 所 得 球 的 颜色 CW: 和 匠 球 ; B: 黑 球 ) 
BWWBW BWWBB BBBWB BBWWHB WWWBB 
BWBBB BBWWB WEWWW BBWWW WWWWB 
WWDBWW WBBWB WWWBB BBBWW BWBWW 
BWWWW BBWBB WWBBW BWWBB WRBWB 
WBWBW BWBBW BBBBW BBBBB BBWBW 
WBWBB WBWBB WBWBW BWBBB WWBBH 
BWWHB BWWBW BWBBW BWBBB WBWBW 
BBBWW WWWDBW WBWWW WWWBB BBWWB 
BBBWW BWWWB BBWWW WWEBW BBBWW 
WWBBW WWBWE BBWBEW BWWWW WBWBW 





BWBBB WWWDBW BWDBBHB WBBWW WBWBB 
WBWBW WWBWB WWBWW BWWWB BBBWB 
WWWWE BBWWW WWWWW BBBBW WWBBB 
BWBWB BBBWW BWWWW BWBBW WBBBBHB 
BBWBB BBWWW BWBWW BWBWW BBBWB 
WWWDBW BWWWW WWWWH BBWBW WWWBB 
WWBWB WWWBB BBBW W BWBWW WWWBW 
BBBWB BWWWB BWWBB BRWBW BBBBB 
WWBEWB WBWWW WHBBW BBWBB WBWWD 
BWBWB BBWBB BBHHHB BBWBW WWWWB 


BWBWH WWBBB BBWWB BWBWB WWBBB 
BWBWB WWBBB BBWWB BWBWB WWBBB 
WWWHBW WBBBB WWWWB BWWWB BBBBB 
WBBWW BBBWB WWHBHBB WWBWW WW BBB 
BBBBW WBWHBB WWBWW BBBWW BWBWW 
WWBRWB WBWDBW WRWWB WBWBW BBBWW 
BWBWB Wwwww BWWWB BBWBW BWBWW 
BBBRW WBWWB WWBRW BWWWW BBBWB 
WBWBB WBWWW WWHWH WWWBEB BBBWW 
WBWBB BBBWW WBBWW WBWBW BWWBB 





1.2 REALE SEH LS 





WBWWW 
WBWDD 
WBBWW 
WWEBW 
WRWBW 
BWWBB 
BWBWBHB 
BBWBW 
BBWWW 
WWWBW 


BBBBW 
WBBWW 
BBBBH 
WWWBB 
WBWBW 
WBHBB 
BWBBW 
WBWBB 
BWWBRW 
BBWBB 


WBBBW 
WWWWNW 
BWWHBH 
WwW Ww 
WBBBB 
BWWWB 
WBWDBW 
WWWBB 
WWWBE 
BWBBW 


BWWWW 
WBBWHB 
BWWWH 
BBWBW 
WBWWW 
BWWWW 
BWWWNW 
BWBBB 
BBBWW 
BWWWW 


WBBWB 
BBWWB 
WBBWW 
BWBBW 
BWBBW 
BWBWW 
WBBWB 
WBWBW 
BWBWW 
WWWWW 


表 1.2 印度 加 尔 各 答 班 - BABA SAM LIEBER (M ARF: KB) 


January 
FMMFF 
FMFMM 
MMMMM 
FMFMM 
FFMFM 
FFMFM 
FFFFF 
FMEFMM 


February 
FFMMM 
MMMEM 
FMMFF 
MFMEM 
FF 

March 

MEF 
MEMFF 
MFFFF 
MMFFM 

April 


FFMEM 
FMFMM 
MMFMM 
FMFFM 


MMMMF 
MMMMF 
MMFMF 
MFMMM 
MFEFMFF 
FMMMM 
FFFMM 
MMFFF 


FFFFM 
MFMFM 
FMMMF 
FMMMM 


FMMMM 
MPMFF 
FMMFEM 
MMMFM 


MFFFM 
MMMFEM 
MMFFM 
MFMFF 


MFMFM 
MMMMM 
MMEFF 
FFMMFE 
FMMFF 
MFMFF 
FMMMF 
FMFFF 


FFFMF 
FFMFM 
FFFFM 
FFMMF 


MMMFM 
FFFMM 
FMMFF 
FFMFM 


FMMFF 
MMMMM 
FMMMM 
MMFMF 


MMFFM 
FFFFM 
MMEMM 
MF FMM 
MFMFF 
MFMFM 
MMMMF 
MMMMM 


FMEFM 
MFMFM 
MMFFF 
FMMFEM 





FFEFF 
FMPFEFM 
MMMMM 


FMFFM 
MFFEM 
FFMMM 
MMMFF 
MFMFM 


FFMFF 
MFMMM 
FFFMF 
FMFMM 
FMMME 
MFMMF 
FMFFF 


FFMFF 
FFMFF 
MMFMM 
MMFFM 
FMMFM 


MMMFM 
FMMEM 
MMFFM 


FFMMM 
MFFMF 
FMFMF 
FMMEM 
FFMFM 
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FFEFM  FMMMF FMFFPF MMFFF MMMFF 
FFMFF FMMMF FMMMF MFMMM MMFMF 
MFMMF FMMFF FMMFEM MMMMM FMMFF 
July 
FMMMM FMMMM FFMFF FFMME FMFMM 
FFFMM FMFFF FMMMM FMFMM MMMMM 
MEMEF MMMMM FMFMM MEMME FMFMF 
MFMMF FFMMM MMMFM MMFFM MMMFF 
FMFFM MFMFF MFFFF MMMMF FFFMM 
FFMMM MMMMF MMMMF FMMFEF FFFMM 
October. 

MMMF FFFMF FMMEM MFMMF MMMMM 
MFMFM FFFFM FMUEFF FMEMM MFFFM 
MFMMF MMFFF FFMFF FMMMM MFMMF 
FMMFF MMMMF FMMFF MMFEM FFFMF 
FMMFEF MMFMM MMMMF FMEFFM MFFMF 
FFMMF FFFMF FFMFF FFMEM FFMFF 
MMFMM FFFMF MFFMF MMMFF FFFFF 
MEF ME M MMFFF MFFMF MMFMF MMMFM 
MFMMF MMFFF FFMFM FFFMM MFMMM 
MFFFM MFMFEF MMFFM MFMMM 
MFMMF FMMMF FFMMF FFFFF FFFMF 
MMFMM MFMFF 
E EREEREER BE BLA Sd clinici n RS (056 年 中 的 几 个 月 . 

















A13 频数 分 布 
3 T 

数 nE "7B i mati 

o 5 4 6.25 

1 27 34 31.25 

2 64 65 62.50 

3 | 65 70 62.50 

4 | 30 2 31.25 

5 9 B 5 6.25 
pr /— 200 | E 200.00 

xe ara 2.22 5.04 
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所 谓 期 望 值 是 指 平均 数 的 理论 值 ， 这 古 企 大 量 重 复 200 次 为 一 组 的 实验 时 平 


TH SUPCR OD. e 1.3 给 出 的 频数 可 分 别 


RAM 1.1 中 的 两 个 直方 图 . 



























































图 1.1 直方 图 








这 两 个 肖 方 图 之 间 非 常 相似 ,也 就 是 说 , 决定 婴儿 性 别 的 随机 结构 与 从 装 有 
相同 数 日 的 两 种 颜色 小 球 的 口袋 中 任 取 一 球 或 是 白 款 或 是 站 球 所 得 到 的 随机 结构 
相同 ,这 也 与 投掷 便 币 出 项 正面 或 是 反面 的 随机 结构 钼 同 .由 上 述 简单 的 练习 可 以 
提供 一 个 公式 化 决定 性 别 的 基础 :上 上 帝 投 搓 硬 币 来 决定 人 的 忻 别 5 SER E, 从 统 
计 检 验 可 以 证 明 , 男 女 凤 出 生 所 产生 的 随机 .二 元 序列 化 起 人 工 生 成 的 随机 列 更 
准确 ,可 以 说 上 帝 是 在 投掷 “ 核 非常 均 勾 的 硬币 . 在 印度 每 一 秒 钟 就 出 生 一 个 婴 
JL, 是 人 们 能 便利 迅速 获得 -元 随机 序列 的 -个 来 源 . 

现实 场合 中 , 除 计算 机 外 ， 人 们 常常 利用 所 谓 道 偏 二 极 管 这 样 的 物理 装置 来 








产生 随机 数 . 这 是 基 上 量子 力学 的 理论 , 假定 在 原子 水 平 下 产 牛 一 定 事件 的 随机 
性 而 做 成 的 .要 注意 的 是 , 这 个 理论 自身 可 以 通过 比较 ,由 观察 得 色 的 数列 和 人 - 
装置 产生 的 数列 来 验证 .但 是 ,数学 家 们 相信 : Seri -个 有 效 的 随机 数列 (使 之 


满足 很 多 规则 ), 不 应 通过 随机 程序 而 要 


利用 适当 的 确定 性 程式 (参见 Hull 和 


Debeli (1962) KKH. 因而 道 过 装置 所 产生 的 数列 被 称 为 伪 随 机 ,在 大 多 数 实 际 
应 用 下， 使 用 这 种 盆 随 机 数列 可以 达到 所 预期 的 目的 . 

通过 比较 我 们 现在 已 经 看 到 , 如 何 利 用 人 工 方法 所 产生 的 随机 数列 来 发 现 类 
似 的 自然 只 中 的 偶然 现象 , 并 能 使 我 们 解释 某 些 自然 现象 的 产生 ， 如 男女 出 生 的 

















序列 . 有 许多 开发 利用 随机 性 的 方法 ， 使 





BOMB MT Ak TONERE H, 


解决 一 些 过 于 复杂 而 又 难以 求 得 精确 解答 的 问题 , 产生 新 的 信息 并 有 可 能 去 帮助 
发 展 新 的 思想 . 下 而 我 将 简单 地 进行 一 些 说 明 . 


1.2.2 蒙特 卡 罗 (Monte Carto) 方 法 


下 .皮尔 森 , 英 国 数学 家 ,同时 也 足 早 期 对 统计 学 理论 和 方法 做 出 重要 页 献 的 


外 ”如 果 考 虑 划分 表 1.1 或 1.2 中 1000 个 符 


导 5 个 一 组 ,- 组 实验 就 有 200 次 .一 一 译 者 注 
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人 ,是 第 一 个 察觉 色 利 用 随机 数 来 解 次 那些 过 于 复杂 而 又 难以 求 得 精确 解答 的 概 
率 和 统计 学 的 问题 的 人 .如 果 已 知 p IE re, 的 联合 分 布 , 如 何 求 出 
HEP. fci ,x2，… yc, PHA DEO 这 个 问题 的 公式 化 解 是 个 不 完全 重 积分 
的 形式 ,位 计算 起 来 非常 困难 . 卡 皮 尔 森 发 现 ,对 这 样 的 问题 , BEUL E T R, 
至 少 可 获得 一 个 近似 解 .为 此 ,他 鼓励 蒂 皮 特 准备 一 个 随机 数 的 表 来 帮助 其 他 人 进 
行 这 方面 的 研究 . ERRAK: 
在 蒙特 卡 罗 玩 轮 盘 署 一 个 月 的 记录 ,可 以 提供 讨论 知识 来 源 的 资 

*. 
这 种 羽 称 为 模拟 或 蒙特 卡 网 技术 的 方法 ， 今 天 在 统计 学 和 所 有 科学 中 已 成 为 解 次 
复杂 数值 问题 的 标准 方法 . 利 几 这 个 方法 ,由 和 牛 成 的 随机 数 进行 一 些 简单 的 计算 
即 呆 . 

模拟 方法 的 基本 原理 很 简单 .例如 在 图 1.2 中 , 要 求 计算 在 给 出 止 方形 图 形 
中 ,不 规则 赂 形 面积 与 止 方形 图 形 面 积 的 比率 大 小 - 出 十 不 规则 图 形 形 状 很 复杂 ， 
个 能 简单 地 用 及 子 测量 米 求 图 形 的 面积 . 更 设 正 方形 相 邻 的 两 边 分 别 为 x 和 y 
Ti, 选择 一 组 随机 数 (x ，y),x，y 均 属于 (0, 5), 这 里 5 大 于 下 方形 的 边 长 ,在 
鞋 方形 内 措 出 坐 怀 点 (<，?). 多 次 重复 这 个 过 程 ,假设 到 某 一 步 时 落 人 不 规则 图 
TE HEROD an. TRAE MEAIB LR BOR m. HRY PEKERE KHA 
尔 莫 妓 洛 夫 建 立 的 大 数 律 的 理论 可 知 : 如 央 薄 人 不 规则 图 形 和 正方 形 中 的 点 (zx， 


















































不 规则 图 形 面积 _ 落 人 不 规则 图 形 内 的 随机 点 数 ae 








ENEMA 正方 形 内 随机 点 总 数 m 
图 1.2 如 何 求 不 规则 网 形 的 面积 一 一 花 特 上 罗 法 或 模拟 法 





1.2 随机 性 与 随机 数 9 





>) 真 止 是 随机 选取 的 , 则 当 m 值 相当 天时， 比值 aul m 趋向 于 不 规划 图 形 面 积 
与 正方 形 面 积 的 真实 比率 . 这 种 方法 的 成 功 ( 或 精确 件 ) 取 决 于 随机 数 产生 器 的 可 
信和 麻 以 及 在 给 出 的 条 件 下 可 产生 多 少 有 关 的 随机 点 数 . 图 1.2 表示 利用 随机 数 估 
计 不 规则 图 形 面积 的 一 个 简单 例子 . 


由 大 数 律 ; =i n 趋向 于 无 穷人 时 ,2 趋向 于 真实 比值 ， 


在 卡 ` 皮 尔 森 的 指导 下 , 他 的 - 些 学 生 利 用 这 个 方法 得 到 一 些 非 常 复杂 的 样 
本 统 计量 的 分 布 .但 是 , 除了 印度 统计 研究 所 的 教授 马 哈 拉 诺 比 斯 (Mahalanobis) 
外 , 当时 这 些 方法 并 没有 被 其 他 大 马上 理解 . 马 哈 拉 诺 比 斯 利用 蒙特 上 罗技 术 ， 
他 将 其 称 之 为 随机 拙 样 实验 , 用 来 解决 各 种 问题 ,如 调查 研究 中 最 佳 抽样 设计 的 
选择 ; 实验 中 最 佳 实验 单位 大 小 以 及 形状 的 选择 等 ,对 这 个 方法 的 泊 在 能 力 没有 
及 时 认识 的 原因 或 许 归 答 于 缺乏 有 效 装置 来 产生 真正 的 .足够 多 的 随机 数 , 这 两 
者 均 会 影响 结果 的 精度 .而 用 由 于 不 存在 生成 随机 数 的 标准 装置 ， 学 术 杂 志 的 编 
辑 们 对 发 表 含有 模拟 结果 的 文章 也 很 勉强 .今天 , 随 着 可 信赖 的 随机 数 和 成 器 的 
出 现 以 及 使 用 的 方 使 ， 情形 已 彻底 改变 了 .我 们 能 够 对 复杂 的 问题 进行 调查 研究 ， 
并 至 少 可 给 出 实际 应 用 的 近似 解 .杂志 的 编辑 们 对 投稿 的 每 篇 论文 即使 是 给 出 了 
解析 的 精确 结果 , 也 坚持 要 有 模拟 结果 .实际 上 , 统计 学 的 研究, 或 许 也 像 其 他 领 
域 一 样 , 研究 的 整个 特点 随 着 殉 强调 “数值 避 近 方法 ”而 在 逐渐 改变 .其 中 典型 的 
例子 是 统计 学 中 由 埃 弗 龙 (Efron) 个 导 的 “ 白 助 法 (bootstrap method) "中 ,这 个 方法 
已 经 非常 普及 .读者 自己 也 可 利用 随机 数 来 进行 研究 . 


1.2.8 抽样 调查 


随机 数 的 第 2 种 用 处 . 也 许 是 最 重要 的 “种 用 处 ,是 在 抽样 调 得 和 实验 中 被 
用 来 生成 要 处 理 的 数据 .考虑 一 个 由 大 量 个 体 组 成 的 总 体 , 我 们 希望 调查 这 个 总 
体 的 人 均 收 人 . 如 果 要 完全 计算 , 即 要 从 每 个 个 休 获 得 的 信息 来 处 哩 数据 , 不 仅 
花费 时 间 和 财力 , 而 且 一 般 来 说 ,为 楼 得 到 正确 的 数据 其 组 织 工 作 也 是 很 困难 
的 ,这 种 方法 并 不 理想 .相对 于 此 , 如 果 只 从 一 个 小 的 群体 (少数 人 的 抽样 ) 收 集 数 
E, 则 会 更 迅速 有 效 而 且 容 易 控 制 , 因 曾 可 保证 数据 的 精确 . 这 时 产生 的 问题 是 : 






































D 自助 法 是 从 总 体 大 小 为 n 的 样本 中 ,有 放 回 地 抽取 大 小 为 x 的 再 生 样本 ,再 依 原 统计 量 
的 函数 形式 ,对 于 此 再 汪 样 本 i| 算 得 到 个 新 的 统计 其 值 , 称 为 自助 统计 晤 值 Cbootstrap value). 
重复 三 述 过 程 多 次 ,这 些 自助 统计 量 值 的 经 验 样本 分 布 可 以 用 来 估计 原 统 计 基 的 分 布 ,从 而 进 
行 统计 推断 .这 种 方法 的 让 要 特点 是 利用 了 现代 计算 机 的 高 性 能 .高 速度 , 比 蒙特 卡 罗 方 法 应 用 
面 更 广 .解决 问题 的 能 力 更 强 . 参见 R. Efron: " Anintroduction to the bootstrap”. New York, 
Chapman & Hall, 1993. 一 一 译 者 主 : 
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应 该 如 何 来 选择 样本 个 体 , 使 其 提供 前 数据 能 使 我 们 得 到 平均 收入 的 一 个 有 效 而 
又 公正 的 较为 准确 的 估计 基 . 一 种 答案 是 利用 随机 数 进 行 简单 的 抽签 方法 . 首先 把 
所 有 的 个 体 标 上 序号 1, 2, 3，…, 然后 在 1 到 NON 为 个 体 的 总 人 数 ) 的 范围 内 
产生 一 定 民 的 随 仙 数 ,选择 这 些 随 机 数 所 对 应 序 导 的 个 体 作为 样本 , 称 之 为 个 体 的 
简单 随机 样本 . 从 统计 学 理论 可 知 , 由 这 个 随机 样本 得 到 的 个 休 平 均 收 人 将 随 样 
本 基 增 加 侧 接 近 于 个 体 平均 收 人 的 真 值 . 实际 中 , Fas RAS KI RED HG Br REOR A 
精确 度 的 界限 来 决定 . 


1-2.4 试验 设计 




















随机 化 是 科学 实验 的 一 个 重要 方面 ,例如 ,为 治疗 某 种 疾病 如 何 设计 -- 种 检 
验 来 验证 药 A they BAR, 或 者 在 给 出 的 不 同 稻谷 的 品种 中 , 如何 确定 其 中 哪 一 
种 为 产量 更 高 的 品种 . 这些 实 验 的 日 的 是 生成 一 些 数据 , 使 能 够 对 所 考 感 的 处 理 
方法 做 出 有 效 的 比较 . 最 初 提 出 实验 设计 这 个 新 课题 的 是 统计 学 家 装 歌 .他 证 实 了 ， 
在 医 续 实验 中 随机 地 把 药 A 和 药 B 分 配给 参加 实验 者 , 在 农业 实验 中 随机 地 把 苦 
于 个 品种 播种 到 各 个 实验 田 里 ， 能 够 生成 有 效 数据 来 进行 各 种 处 理 方法 的 比较 . 


1.2.5 通讯 的 秘密 化 


在 密码 学 ,或 者 使 用 密码 传送 文件 以 及 为 个 人 银行 存 取 业 务 保守 秘密 之 中 均 
需要 大 量 的 随机 数 ， 

在 保守 机 密 显 得 极为 重要 的 高 层次 的 外 交 和 军事 通信 中 ,秘密 化 就 是 要 使 任 
何 非 法 接 通 通讯 网 的 人 所 能 得 到 的 仪 仅 是 一 些 看 似 随 机 组 合 的 数列 , 为 达到 此 目 
的 ,首先 要 生成 仅 有 发 报 者 和 收报 者 知道 的 被 称 为 密码 的 一 串 二 元 随机 数列 . 发 报 
者 先 把 要 发 送 的 内 容 转换 成 一 串 一 抱 数 列 , 按 通常 的 方法 把 每 一 字符 转换 为 标准 
的 8 比特 的 计算 机 电码 (例如 字母 a 转换 为 01100001) .然后 发 报 者 在 密码 串 下 面 
对 应 写 出 要 发 送 的 讯息 串 , 再 得 到 - -个 电码 化 后 的 字符 串 , 即 可 以 在 所 有 电码 比特 
为 1 的 下 而 进行 转换 而 在 0 下 面 保持 不 变 .这 样 电码 化 后 的 字符 串 传送 时 看 起 来 
仅仅 是 一 个 随机 的 二 元 数列 .收报 者 收 到 所 传送 的 内 容 后 ,利用 已 知 的 密码 由 同样 
的 方法 解密 . 下痢 为 一 个 例子 : 














E 码 0100011 随机 列 

传送 内 容 1011001 发 报 者 的 讯息 
秘密 化 后 的 内 容 1111010 传送 的 讯息 
密码 0100011 同一 随机 列 


解密 后 文件 1011001 接受 者 收 到 的 
银行 利用 基 了 随机 数 的 密码 来 保证 现金 取款 包 进 行 交 易 的 保密 . 为 达到 此 目 
的 ,首先 产生 随机 数列 作为 一 个 把 讯息 转换 为 电 倘 的 密码 , 仪 仅 在 知道 密 但 的 情 
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沈 下 才 呈 解密 .然后 把 密码 传送 给 中 央 计 算 机 和 现金 取款 机 ,两 个 装置 自由 上 地利 
用 电话 进行 信息 道 讯 而 不 必 担 心 被 鹤 听 . 当 接 到 现金 取款 机 传送 过 来 的 客户 的 账 
导 和 他 要 水 支付 的 现金 总 额 时 ,中央 计算 机 验证 客户 的 账号 和 现金 收 支 记录 后 再 
指示 现金 取款 机 是 什 可 以 支付 现金 给 这 个 客户 、 


1.2.6 ”随机 性 作为 建 模 的 一 种 工具 


在 解决 各 种 统计 问题 中 ,对 随机 数 的 早期 利用 , 已 经 为 把 随机 数 用 于 模型 构 
造 和 预测 开拓 了 道路 .已 发 展 构建 了 这 种 模型 的 领域 包括 天 气 预报 、 预 测 商 品 消 
费 需求 和 住房 医院. 学校, 交通 设 施 这 样 - - 些 社 会 服务 设施 的 未 来 需求 等 等 . Sb 
德 伯 柔 特 (Mandelbroat，1982) 提 出 利用 随机 断 片 来 构造 诸如 一 个 国家 不 规则 的 海 
岸 线 以 及 自然 界 物 体 不 规则 形状 的 复杂 曲线 模型 . 


1.2.7 随机 数 应 用 于 解决 复杂 问题 


随机 数 的 某 些 现代 应 用 开拓 了 对 随机 数 发 生 器 的 大 量 需求 ,其 用 于 解决 一 些 
诸如 巡回 推销 员 的 路 径 那 样 的 复杂 问题 , 即 必 须 确定 一 条 最 短 的 路 线 使 推销 员 由 
给 定 的 出 发 点 开始 , 经 过 一 系列 必须 去 的 地 方 后 再 返回 到 出 发 点 ， 

另 一 个 有 趣 的 问题 是 国际 象棋 的 程序 化 .尽管 国际 象棋 是 一 个 具有 完整 信息 
的 游戏 ,但 人 -智能 CAI) 程序 常常 结合 随机 移动 棋子 的 方法 来 避免 游戏 的 过 于 
复杂 . 

随机 数 以 及 随机 性 概念 应 用 的 范围 似乎 是 无 限 的 . 


1.2.8 ”对 随机 数列 的 误解 


随机 数 没有 特定 的 形式 , 但 又 包含 着 所 有 的 形式 ,随机 数 这 样 一 个 有 趣 的 性 
质 就 像 印度 教 对 神 的 概念 一 样 .这 就 是 说 , 如 果 我 们 在 严格 的 意义 下 不 断 产生 随 
机 数 ,无 论 给 出 什么 样 的 数 的 形式 ,这 个 形式 退 早 总 会 出 现 . 因此 ,如 果 不 断 投 
饪 硬币 ,在 某 一 时 刻 会 连续 出 现 1000 次 正面 , 明 我 们 不 会 感到 售 奇 ,如 果 我 们 有 
只 聪明 的 猴子 并 让 它 不 断 地 打字 , 在 “个 有 限 但 相当 长 的 时 间 内 , 它 应 该 能 打出 
卡 士 比 亚 的 所 有 作品 .(《 哈 姆 尖 特 ) 一 剧 共有 27 000 个 字符 和 空格 ,打字 机 打出 这 
个 剧本 的 可 能 性 , 粗 咯 的 说 为 10-", 这 个 数字 给 我 们 一 个 概念 ， 即 发 生 这 样 的 
事 我 们 需要 等 待 多 长 时 间 .) 

无 特定 的 形式 却 又 包含 一 切 形 式 的 随机 数列 的 这 个 性 质 已 经 使 人 产生 了 一 些 
误解, 甚至 包含 哲学 家 那样 的 人 . 波 利 亚 (Polya) 的 一 段 有 关 一 个 医生 的 趣闻 例证 
了 一 种 被 称 为“ 赚 徒 误解 "的 说 法 .这 个 话 牛 安慰 他 的 病人 说 : 

你 冲 了 一 种 非常 严重 的 病 ， 冲 这 种 病 的 人 只 有 十 分 之 一 能 活 下 来 . 

但 是 你 不 必 坦 心 ， 你 到 我 这 儿 来 看 病 是 十 分 丰 运 的 ， 因为 最 近 有 九 个 意 
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你 这 种 病 的 人 到 我 这 儿 来 治疗 ,他 们 都 去 世人 了 了 

德国 哲学 家 马 比 (Karl Marbe, 1916) 就 非常 坚持 这 种 观点 . 基于 他 调查 的 巴 伐 
利 亚 州 的 4 个 城镇 200 000 个 人 的 出 生 记录 , 他 总 结 到 : 如 昌 过 去 儿 天 连续 出 生 
的 女 婴 相当 多 的 话 , 就 会 增加 一 对 大 如 得 到 男 婴 的 机 会 . 

另 - -种 与 马 比 的 统计 安定 论 类 似 的 观点 是 另 一 个 哲学 家 斯 特 任 格 尔 (O- 
Sterzinger, 1911) Be Bi RPE”. xx - -观点 形成 “ 链 法 则 ”, 或 者 说 同 事件 在 
短 时 间 内 容易 连续 发 生 这 :趋势 的 理论 基础 . 生物 学 家 卡 默 雷 尔 (P，Kammerer， 
1919) 把 这 种 观点 公式 化 了 .谚语 说 “被 不 单行 ”， 人 们 总 是 真诚 地 接受 这 个 观点 并 
用 二 一 切 场 合 . 纳 利 卡 (Narlikar，1982) 教 授 在 印度 统计 研究 所 第 16 局 学 位 授予 
典礼 的 致辞 中 提 到 了 由 RTS GEL OE DER CP. Hoyle) RIZR CM. Ryle) 2 
间 的 争论 . 纳 利 卡 教授 提 到 他 的 模拟 或 蒙特 FUELS RU, — 1 ROB ATI ABET 
以 按 `: 定 的 频 举 展示 出 某 些 局 部 的 不 均匀 性 ( 即 相 加 的 驶 象 在 揭 时 间 兴 连续 发 
生 ). 因 此 , 赖 亚 对 放射 源 密度 中 不 均匀 性 的 观测 结果 与 性 亚 的 字 宙 稳定 状态 的 理 
论 并 不 矛盾 . 

再 让 我 们 来 看 看 男 一 个 例子 .大 多 数 动 物种 类 的 存活 总 数 大 致 是 以 3 年 为 一 
周期 的 ,也 就 征 说 ,其 种 动物 存活 总 数 相 邻 的 两 个 高 峰 华 的 时 间 间 隔 平均 约 为 3 
年 (这 时 所 说 的 高 峰 第 ,定义 为 与 前 后 年 相 比 动物 总 数 最 多 的 一 年 ). 这 种 现象 的 普 
遍 存 在 使 很 多 人 相信 或 许 已 发 现 了 白 然 界 的 -一 个 新 法 则 .不 过 ,如 果 注 意 到 当 等 间 
陋 地 描述 随机 数 , 随 着 随机 数 序列 变 长 其 相 邻 两 个 高 峰 问 的 间隔 接近 于 3 时 ,这 种 
确信 会 济 到 致命 的 --- 击 . 实际 上 这 一 人 性质 很 容易 被 下 述 事 实 所 证 实 : 任 给 三 个 随 
机 数 的 集合 中 , 中 问 一 个 数 比 其 余 歇 个 数 大 的 概率 为 三 分 之 一 ， 这 就 给 出 了 上 述 
问题 中 两 个 商 峰 年 的 平均 时 间 间 隔 为 3 年 . 


1.2.9 ”对 敏感 问题 的 随机 反应 


应 用 随机 性 的 芬 .一 个 有 趣 的 例子 是 对 敏感 问题 的 真实 回答 . 如 朵 我 们 提出 这 
样 一 个 问题 :“ 你 吸 大 麻 吗 ?” 慌 怕 我 们 得 不 到 正确 的 答案 .对 此 , 我 们 的 另 -种 做 
法 是 列 出 如 下 两 个 问题 (其 中 一 个 问题 是 尤 关 紧要 的 ): 

S: RARR? 

T: 你 的 电话 号 码 的 末尾 数 尼 偶数 吗 ? 
然后 要 求 被 提问 者 投 拓 一 个 使 币 ， 出 现 正面 时 要 求 正确 回答 S, 出 现 反面 时 要 求 
正确 回答 .这 时 提问 者 并 不 知道 被 问 者 回答 的 是 哪 一 个 问题 ,这 个 信息 是 保密 
的 .从 这 些 得 到 的 答案 可 做 如 下 估计 推算 出 吸 大 麻 的 人 所 占 的 真正 比例 . 设 : 

一 吸 大 朵 的 人 的 比率 ， 是 本 知 的 要 估计 的 参数 . 

A= 电话 号 码 末 尾数 为 个 数 的 人 的 比率 , 已 知 . 

p= 回答 “是 "的 人 的 比率 , BH. 
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由 上 可 得 : w+ A=2p, 由 此 推出 4 的 估计 值 为 + = 2p - A. 


1.3 从 决定 论 到 无 序 中 的 有 序 


下 面 来 痰 谈 正 在 通过 随机 性 的 横 念 来 加 以 解决 的 - 些 更 基本 的 问题 .这 些 问 
题 涉及 到 字 害 间 模 型 的 构造 ,以 及 自然 界 法 则 的 形成 . 

在 过 去 很 长 - 段 时 间 内 ， 人 们 相仿 所 有 自然 界 的 现象 都 明显 地 带 有 项 定 的 特 
点 ,其 中 最 极端 的 表述 可 以 在 拉 普 拉 斯 (Laplace，1812)" 数 学 神灵 ”的 思想 中 发 现 . 
“数学 神灵 "被 赋予 县 有 无 很 的 数学 演绎 的 能 力 ,如果 存 某 一 时 刻 他 知道 刻画 当时 
状态 的 所 有 量度 时 , 这 个 神志 就 可 预测 未 来 世界 将 要 发 和 后 的 一 切 事件 .就 如 我 已 
提 及 的 , 从 史前 或 有 史 以 来 , 决定 论 已 在 人 类 思想 形态 中 根深 蒂 固 .作为 -个 概 
T, 决定 论 合 有 两 方面 的 意义 .广义 上 讲 , 决定 论 大 条 件 相信 形式 逻辑 作为 对 好 
部 世界 认 知 和 描述 的 1 具足 万 能 和 有 有力 的 .狭义 而 言 , 它 则 是 一 种 信 修 ,相信 世 
间 一 切 现象 和 事物 均 是 服从 因果 规律 的 ,更 进 -- 步 来 看 , 至 少 在 原理 上 决定 论 坚 
入 对 因果 律 这 一 类 法 则 的 发 现 是 可 能 的 ,人 们 对 由 界 的 认 知 均 是 由 这 些 因果 律 演 
绎 而 成 的 .然而 , 衣 到 19 世纪 中 叶 人 们 才 认 识 到 寻求 自然 的 决定 性 法 则 在 逻辑 上 
和 实际 中 的 困难 ,从 而 开始 了 对 基于 偶然 性 结构 的 可 远 代 异型 的 研究 . 

拉 普 拉 斯 的 数学 之 神 的 另 - 方 而 的 考虑 与 系统 的 初始 状态 的 知识 有 关 . 众 所 
周知 : 由 于 存在 测量 误差 , 很 难 准确 了 解 系统 的 初始 状态 ( 即 不 带 误差 时 的 状 
FS) .在 这 种 情形 下 , 便 存 在 着 出 初始 状态 下 的 微小 差别 面 导 致 对 系统 未 来 状态 预 
报 的 极 大 差异 的 可 能 性 .说 伦 获 (Lorenz) 1961 年 所 描绘 的 几乎 由 同一 时 间 点 开始 
的 两 个 长 期 气象 预报 模式 ,给 我 们 提供 了 一 个 典型 的 例 É 
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Gieick) 的 《混沌 》(1987) 一 书 中 转载 的 . 它 显示 了 人 在 相同 的 规律 下 气象 模式 如 何 册 
同一 状态 开始 , 即 由 测定 值 0.506 217 WE IAB] 0.506 FR, TEA, A 
至 所 有 相同 点 消失 掉 . 这 种 敏感 地 依 炉 于 初始 状态 的 现象 被 称 之 为 "蝴蝶 效 
应 "一 一 这 个 观点 由 是 , 今天 在 北京 上 空 飞 期 的 一 只 蝴蝶 ， 下 个 月 能 在 华盛顿 制 
造 出 一 场 风暴. 
在 3 个 不 同 的 调查 领域 内 儿 乎 同时 产生 了 3 个 重要 发 展 , 而 这 三 个 发 展 都 是 
基于 随机 性 辟 自 然 界 固有 的 这 个 前 提 之 上 的 .凯特 勒 (AQuetlet，1869) 利 用 概率 
论 的 概念 来 描述 社会 学 和 生物 学 现象 . AWG. Mendcl，1870) 适 过 简单 的 随机 
性 结构 ,如 投 找 散 于 ,公式 化 了 他 的 遗传 法 则 . 玻 尔 兹 曼 (Boltzmann，1866) 对 理论 
物理 中 最 重要 的 基本 命题 之 一 .的 热力 学 第 二 定律 给 出 了 一 个 统计 学 的 解释 .这些 
伟人 所 提出 的 这 些 思想 观点 是 让 然 界 的 一 场 革命 .虽然 他 们 这 些 观点 在 当时 并 没 
有 被 立即 接受 , 但 在 20 世纪 内 所 有 这 些 利用 统计 学 概念 的 领域 都 有 了 过 速 的 发 
展 . 

在 物理 学 中 引信 统 计 概 念 是 由 处 理 天 文学 中 的 测量 误差 的 需要 而 开始 的 . 00 
利 略 中 (Galileo，1564-~-1642) 发 现 ,即使 是 在 相等 的 条 件 下 ,重复 测量 的 值 也 有 变 
化 .他 强调 说 ， 


测量 , 重复 测量 , 再 重复 测 重 ,就 能 找 出 误差 ,以 及 误差 的 误差 . 


KA 200 年 以 后 , 高 斯 (Gauss, 1777 一 1855) 研 究 了 测量 中 误差 的 概率 法 则 ， 提 出 
了 综合 多 个 观 浏 值 来 估计 末 知 量 的 最 佳 方法 - 

此 后 的 一 个 阶段 ， 统 计 思想 虽 用 于 调整 初始 状态 下 的 不 确定 性 以 及 一 系列 不 
可 控制 外 来 内 素 的 影响 , 但 物理 学 的 基本 法 则 仿 以 决定 论 为 先决 条 件 . 

当 利用 概率 论 术 庄 米 描述 基本 法 则 自身 , 特别 起 基 本 粒子 的 微 移动 时 , 物理 
学 才 产生 了 本 质 上 的 变化 . 随机 行为 被 认为 是 “大 多 数 事物 的 通常 作用 以 及 它们 的 
模式 所 应 有 的 、 不 可 缺少 的 部 分 "为 了 解释 所 给 系统 的 这 种 随机 行为 而 构造 了 统 
计 模 型 .作为 这 种 模型 的 例子 ,我们 可 举 出 布朗 运动 ,放射 性 物质 所 引起 的 闪烁 ， 
海 森 伯 (Heisenberg) 的 不 确定 性 原理 ， 具 等 质量 分 子 的 麦克 斯 韦 速度 分 布 等 等 ， 
所 有 这 些 都 为 当今 的 量子 力学 开拓 了 道路 .人 类 思维 方法 的 这 种 变化 由 著名 物理 























CD AFIR -AFIR (Galileo Galila) 一 一 个 是 以 姓 , 而 是 以 他 的 名 字 而 闻名 于 世 的 意大利 天 文 
学 家 ,数学 家 和 物理 学 家 ,被 称 为 现代 实验 科学 之 葛 基 人 .他 欧 名 字 与 押 动 法 则 ,月 亮 的 四 趾 表 
现 , 太 阳 黑 子 , 木 虹 的 四 颗 明 亮 的 卫星 以 及 望远镜 的 发 明 等 著名 发 现 相 联系 在 一 起 .这 些 发 现 和 
发 明 使 伽利略 确信 哥 白 尼 (Copernicus) 的 " 哥 白 尼 学 说 ", 即 地 球 以 自身 为 轴 , 绕 着 太阳 自转 是 真 
实 的 .但 贡 白 尼 学 说 当时 是 与 教会 的 教义 要 矛盾 的 ,由 宗教 裁决 ,伽利略 被 强迫 撤回 了 他 的 观 
点 .有 趣 的 是 ,我 们 注意 到 , 儿 年 以 前 现 作 的 罗马 教皇 ,基于 他 手下 的 个 委员 会 提交 给 他 的 报 
EE CENE CLIE AT RE IDE 





1.4 随机 性 与 创造 性 





学 家 玻 恩 (M. Borm) 简 沽 地 表述 为 : 


我 们 已 经 看 到 传统 物理 学 如 何 徒劳 无 益 地 力图 使 大 量 的 观测 结果 与 
基于 由 日 常 经 验 导 出 但 已 上 升 为 形而上学 的 因果 论 的 先 验 概念 一 致 ; 如 
何 徒 劳 地 抵制 随机 性 的 侵入 .今天 ,次 序 已 经 颠倒 过 来 了 : 随机 性 已 经 
成 为 一 种 基本 概念 ， 表示 定量 法 则 的 一 种 技术 .而 且 ， 在 通常 的 经 验 范 
BA, 涉及 因果 律 及 其 属性 的 绝 大 多 数 的 结果 ， 均 可 由 统计 学 的 大 教 定 
律 来 园 满 地 加 以 说 明 . 

另 一 著名 物理 学 家 埃 丁 顿 (A. S，Eddington) 做 了 更 进一步 的 阐述 : 

近年 来 , 物理 学 预期 中 某 些 最 伟大 的 成 就 被 公认 是 源 于 统计 学 法 
则 ,而 并 不 是 依赖 于 因果 律 . HA, 迄今 作为 因果 关系 所 接受 的 某 些 重 
要 的 法 则 经 过 仔细 研究 后 ,可 认为 这 些 均 是 具有 统计 学 特征 的 . 


很 多 科学 家 并 不 欢迎 用 统计 学 法 则 取代 决定 论 法 则 的 概念 , 共 中 甚至 包括 我 们 这 
个 时 代 最 联 明 的 科学 家 爱 因 斯 坦 . 直到 他 人 生 的 最 后 时 刻 ， 爱 因 斯 几 仍 坚持 ; 


我 十 分 坚信 ,最 终 会 有 人 发 现 一 种 理论 ， 这 种 理论 与 各 种 法 则 相关 
联 ,但 它 所 研究 的 对 象 不 是 概率 意义 上 的 而 是 被 尊重 的 事实 .迄今 仍 认 为 
青 在 这 种 理论 ,然而 ,我 的 这 种 确信 并 不 能 基于 茶 种 到 辑 推 理 ， 只 能 以 
我 个 人 不 多 的 经 验 来 说 明 . 这 就 是 说 ,我 没有 能 力 提 供 这 个 理论 ,去 评价 
我 自身 范围 之 外 的 任何 事物 . 


但 是 , 士 分 让 人 惊奇 的 是 , 爱 因 斯 地 接受 了 由 玻 色 (S.N,， Bose) 提 出 的 分 子 的 随机 
行为 的 考虑 , 并 由 此 产生 了 玻 色 - 爱 因 斯 昌 理 论 . 

《就 像 原 子 和 分 子 的 个 体 游 动 一 样 , ) 尽管 单个 水 平 下 的 游 动 存在 不 确定 性 ， 
但 对 大 量 个 体 活动 的 平均 行动 来 说 , 我 们 可 以 观察 到 某 种 稳定 性 ， 即 会 出 现 “ 无 
序 中 的 有 序 ”， 概 举 论 中 存在 被 称 为 大 数 律 的 命题 , 这 个 命题 解释 了 这 种 现象 .大 
数 律 断言 , 一 个 系统 中 多 个 个 体 平均 行为 所 显示 的 不 确定 性 将 会 随 着 个 体 总 数 的 
不 断 增加 而 逐渐 减少 ,因而 可 以 把 这 个 系统 作为 一 个 整体 ,其 表现 的 几乎 是 决定 性 
的 现象 ,“ 越 多 越 保险 ”这 条 名 言 , 确实 有 一 个 很 强 的 理论 基础 ， 





















































1.4 ”随机 性 与 创造 性 


我 们 已 经 看 到 , 在 需要 用 概率 术语 来 描述 其 自然 法 则 的 自然 界 中 , 随机 性 是 
固有 存在 的 .我 们 讨论 了 在 抽样 调查 和 实验 设计 中 如 何 首 先 运用 随机 性 的 概念 去 
观测 总 体 的 小 部 分 , 进而 由 此 获取 有 关 总 体 的 信息 . 我们 也 看 到 如 何 引 人 戎 机 
性 来 解决 推销 员 的 巡回 路 程 和 其 他 诸如 此 类 的 复杂 问题 , 在 这 些 问 题 中 虽 有 决定 
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论 的 求解 方法 存在 ,位 过 于 复杂 .我 们 还 研讨 了 如 何 利用 随机 数 在 通讯 中 保守 通信 
BUR TERRE AUR ,随机 性 起 任何 作用 蚂 ? 或 者 说 我 们 可 以 通过 一 种 随机 途径 
来 解释 创造 性 吗 ? 

fl X epist? 创造 性 可 以 有 不 同 的 种 类 .最 商 水 平 的 创造 性 是 -种 新 思想 
和 新 理论 的 产生 ,这 种 新 由 想 或 新 理论 与 企 何 已 存在 的 结构 有 着 本 质 的 不 同 或 是 
SERA RE, 完全 不 能 从 已 有 的 理论 演绎 而 成 ,这 种 新 思想 或 新 理论 可 以 比 任何 
已 知 的 理论 解释 更 广 范围 的 白 然 现象 ,另外 一 种 不 同 水 平 的 创造 性 是 指 在 一 个 岂 
存在 法 则 范围 内 的 新 发 现 , 但 这 种 新 发 现在 某 个 特殊 的 领域 内 具有 所 大 的 意义 . 
可 以 确认 ,这 两 种 创造 性 均 是 新 知识 的 源泉 .然而 两 者 之 问 存 在 微小 的 区 别 :第 1 
种 情形 中 , 创造 的 是 一 种 先 验 的 思想 , 将 由 后 来 对 事实 的 观察 来 加 以 验证 ; 第 2 
种 创造 性 则 是 对 现 有 知识 在 逻辑 上 的 扩展 . 我 们 或 许可 以 对 第 2 种 创造 性 的 产生 
过 程 的 背景 做 - 些 想像 ， 调 第 1 种 创造 性 的 产生 却 超越 了 我 们 的 理解 . 拉 曼 纽 扬中 
和 爱 因 斯 坦 是 如 何 创造 出 他 们 所 做 的 工作 ? 尽管 他 们 对 创造 性 有 -… 些 神秘 的 解 
释 ,我 们 孝 永远 不 会 了 解 他 们 工作 的 实际 过 程 , 然而 我 们 可 以 用 某 些 方法 来 描述 创 

非常 重要 的 发 现 决 不 是 巾 滩 辑 推断 和 强化 观测 基础 米 得 到 的 .显而易见 ,创造 
性 的 一 个 必要 条 件 是 让 思维 不 受 已 有 知识 或 成 形 的 规划 所 束缚 ,让 其 能 自由 地 轴 
考 .或 许 产 生 新 发 现 之 前 的 思考 仅 仪 是 一 个 模糊 的 形式 ,是 随机 搜索 相互 作用 的 一 
次 成 功 .这 种 随机 搜索 可 找 出 一 些 新 的 框架 ,与 过 去 的 经 验 和 潜在 的 意识 一 致 ,从 
而 缩小 新 发 现 可 能 产生 的 范围 . 克 斯 特勤 (A. Koestler) 在 描述 创造 性 的 思维 时 说 : 


在 发 现 的 最 后 的 决定 性 阶段 ,思考 的 内 容 漂 浮 在 梦 里 、 筷 想 中 ， 盘 

席 着 整个 思维 ,此 时 思潮 随 着 自己 抑 扬 的 情绪 无 拘 无 束 地 活动 ， 明显 地 

处 于 一 种 没有 任何 约束 的 状态 . 
当 一 个 发 现 最 初 被 公布 时 , 在 其 他 人 看 来 会 是 没有 任何 意义 , 比 看 起 来 非常 主观 ， 
实际 上 对 爱 因 斯 坦 和 拉 昌 纽 扬 的 发 现 的 反应 就 是 如 此 .经 过 数 年 的 实验 和 验证 才 
认可 了 爱 央 斯 地 的 理论 为 一 种 新 的 规范 , 也 许 要 经 过 半 个 世纪 才能 认识 到 拉 曼 纽 
扬 那 个 看 起 来 很 离奇 的 公式 具有 深奥 和 意义 非 几 的 理论 基础 ,关于 随机 思维 、 随 机 
性 在 创造 性 中 的 作用 , RRE Hofstadter) fE r iu TIFE: 


众所周知 ,随机 性 是 创造 性 不 可 缺少 的 因素 .…… 随机 性 是 人 类 思 
维 中 内 在 的 特征 ， 不 是 通过 赌博 、 衰 碱 原子 核 、 随 机 数 表 或 其 他 你 所 知道 


























D FERES (Ramanujan) ,印度 苦 名 数学 家 ,被 称 为 是 亚洲 神秘 的 数学 天 才 .他 留 下 了 大 量 
的 公式 和 定理 ,但 均 无 证 明 . 本 书 附 录 忆 给 出 了 拉 曙 组 扬 的 生平 .读者 还 可 和 参见 |， R Newman 
Bi" Ramanujan” . science, American , 1970. 一 一 泽 者 注 
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的 来 人 为 培植 的 . 如 果 认为 随机 性 就 是 随心 所 欲 的 话 ， 则 是 对 人 类 创造 
Tet di 


或 许 ， 随 机 思考 是 创造 性 的 重要 成 分 . 但 是 如 时 把 它 作为 惟 的 因素 , 则 各 
种 不 重 些 的 推 汤 都 会 像 蜂 蛛 网 似 的 田 在 前 面 ,速度 之 快 会 使 逻辑 推导 难于 与 其 回 
步 ,所 以 我 们 鉴 求 其 他 的 因素 ,如 细致 的 心理 准备 , 对 重 机 的 有 显著 意义 的 问题 的 
判断 能 力 , 迅速 领 惜 什么 翌 的 思想 能 够 产生 起价 的 结果 . 最 重要 的 是 要 具有 GE 
的 信心 去 追踪 研究 困难 的 问题 .最 后 -个 方面 是 当今 很 多 科学 研究 中 所 缺乏 的 , 关 
于 这 一 点 , 爱 因 斯 时 曾 强调 ; 

我 丝毫 不 能 容忍 某 些 科学 家 ,他 们 取 一 块 木板 在 上 面 寻 找 最 薄 的 部 

位 ,在 那些 容易 打 孔 的 地 方 钻 开 无 数 个 孔 


我 已 经 提 到 爱 因 斯 坦 和 拉 曼 纽 扬 是 我 们 这 个 时 代 两 位 共有 创造 性 思维 的 伟大 
思想 家 ,或 许 了 解 一 点 儿 有 关 他 们 创造 性 恩 维 的 过 程 是 有 趣 的 .有 大 间 到 爱 因 斯 坦 
关 寸 创造 性 思维 的 问题 时 ， 爱 因 斯 坦 这 样 同 答 s 

任何 写 出 的 \ 讲 过 的 词汇 或 语言 在 我 思考 的 丫 构 中 似乎 不 起 任何 作 

朋 ， 作 为 思维 元 素 存 在 的 物质 实体 似乎 是 某 些 符号 ， 和 一 些 或 明 或 暗 的 

想像 ,这 些 想像 被 * 随 心 所 忽 地 "再 生 和 组 合 .…… 这 种 组 合 性 的 思维 活动 

似乎 是 创造 性 思维 的 基本 特征 一 一 这 种 思维 活动 产生 于 存在 一 种 能 用 文 

字 或 其 他 疹 号 来 与 其 他 人 交流 的 逻辑 性 结构 之 前 
爱 因 斯 坦 研 究 的 是 科学 中 的 一 个 重 归 分 支 一 物理 学 , 一 个 科学 理论 只 有 当 在 现 
实 世 界 中 建立 起 它 的 实际 应 用 之 时 才 赴 有 价值 的 ,但 是 这 个 科学 理论 在 它 产生 的 
初期 ,是 由 强 你 的 信心 而 不 是 由 演绎 或 归纳 推导 来 支撑 的 . 这 个 观点 反映 在 爱 内 
斯 坦 的 关于 神 的 旨意 的 格言 中 : 

HARM, BATRES 


PLA SERN , OR, BOP REE AN (Wiener) BOUE, 在 严格 的 意义 
下 数学 是 一 门 精美 的 艺术 .一 个 数学 定理 的 有 效 性 是 就 它 严格 的 证 明 而 言 的 .就 像 
数学 家 要 让 人 们 相信 的 那样 :与 其 说 定理 本 身 不 如 涪 它 的 证 明 是 数学 . 对 拉 曼 纽 
扬 而 言 却 内 有 定理 或 公式 ,这 些 定理 或 公式 的 有 效 性 是 基于 他 的 直观 碟 信 念 的 . 
拉 曼 纽 扬 以 极 美的 艺术 品 的 形式 记录 下 他 的 公式 一 一 他 涪 这 些 公 式 是 上 帝 在 梦 中 
赐 给 他 的 ,一 个 方程 除非 可 以 用 来 表达 上 帝 的 一 个 关 意 ,否则 对 他 来 说 就 是 无 意义 
的 .上帝 、 美 和 真理 这 二 者 被 认为 是 等 同 的 .如果 拉 曼 纽 扬 不 相信 这 -- 点 ,我 们 就 
不 会 有 拉 曼 纽 声 了. 

拉 曼 纽 扬 生 前 最 后 一 年 在 一 本 笔记 中 留 下 了 大 量 的 定理 .这 个 笔记 本 几 年 前 
刚 被 发 现 , 其 中 记载 了 大 量 的 猜想 ,下 面 是 其 中 之 一 : 
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PLAGNE - 书 中 的 某 个 猜想 (公式 ) 


让 拉 曼 纽 扬 的 《补遗 杂记 》-- BASHA Ba WAY G. 安德鲁 斯 (G，E- 
Andrews) 教 授 了 告诉 我 ,上 面 公式 的 前 二 行 (被 你 为 虚 6 狂想) 最近 已 被 宾 州 州立 
大 学 的 希 克 森 (D.R. Hickerson EHH f. 
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内 :讨论 
A-1 偶然 性 和 混沌 


在 一 次 有 关 本 章 内 容 讲演 后 的 讨论 中 ,有 人 间 我 关于 混沌 的 问题 ,混沌 一 词 
是 用 来 描述 “ 像 随 机 "那样 的 现象 , 以 太 它 与 偶然 性 和 不 懈 定 性 研究 的 关系 .我 的 
BARI 

所 谓 偶 然 性 是 用 来 措 述 彩票 中 抽奖 数字 那样 的 随机 现象 的 . BFR AE KI 
数列 变 长 就 会 显示 某 种 规律 , 这 个 规律 可 由 概率 计算 米 解释 , 另 -方面 ,人们 观 
测 到 由 一 确定 程序 产生 的 数字 ,整体 规则 之 中 可 以 显示 出 局 部 的 像 随 机 那样 的 行 
为 .过 去 20 年 来 科学 家 们 已 经 开始 研究 后 一 种 类 型 的 现象 , 并 把 此 现象 称 为 混 
沌 .这 是 对 复杂 的 轮廓 和 形状 ,如 云 的 形式 . 乱 气 流 、 一 个 国家 的 不 规则 的 海岸 线 
模型 化 的 一 种 新 途径 ， 甚 至 可 以 用 简单 的 数学 方程 式 来 解 炙 股 紫 市 场 价格 的 变 
化 ,这 种 类 型 的 思考 方法 与 采用 侦 然 性 结 移 去 描述 一 个 系统 的 结果 有 些 不 同 .偶然 
性 是 研究 无 序 中 的 有 序 , 而 混沌 是 研究 有 译 中 的 无 序 .它们 都 适用 于 观察 现象 的 
模型 化 ， 

出 于 爱德华 .党 伦 兹 发 现 的 所 谓 “ 贿 蝶 效 应 ”, 或 者 站 说 一 个 系统 敏感 地 依赖 于 
它 的 初始 条 件 , 混沌 的 研究 开始 引 人 注 目 .在 长 期 的 气象 硕 报 中 , 洛 伦 兹 观测 到 
顶 测 公式 中 输入 的 初始 测量 的 其 些微 小 误差 , 在 阮 测 结果 时 可 能 扩大 为 很 大 的 误 
差 . 曼 德 伯 柔 特 所 提出 的 分 形 儿 何 学 是 用 来 描述 -类 大 小 不 同 、 但 变化 相同 的 轮 
廓 形状 的 .利用 曼 德 伯 柔 特 的 分 形 妃 何 学 ,可 以 解释 我 们 在 自然 界 中 所 发 现 的 那 
此 “参差 不 齐 的 、 紊乱 的 、 断 裂 的 ,扭曲 的 和 破碎 的 "形状 , 如 雪花 片 的 形状 , 一 个 
国家 的 海岸 线 等 等 . REM. J. Feigenbaum) AE T E CERA 


x, f(x), FEC), on 


发 展 了 一 种 奇妙 的 有 魅力 的 概念 , 提出 了 对 描述 诸如 流体 乱 流 等 若 上 物理 现象 的 
一 个 正确 的 模型 . 
科学 家 们 所 谈论 的 混沌 ， 其 本 质 是 数学 .由 于 使 用 计算 机 ,对 混沌 的 研究 已 成 
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为 可 能 而 用 具有 吸引 力 . 这 是 一 种 爱好 而 且 问 报 不 菲 , 它 为 通过 确定 性 的 模型 米 模 
式 化 自然 界 中 所 观测 到 的 现象 上 创 了 新 方法 . 

个 有 趣 的 例子 是 巾 著名 的 数学 家 卡 克 给 出 的 (参见 他 的 自传 《偶然 性 之 演 》 
(Enigmas of Chance) ,74 —76 Jt, 1985 年 , 纽约 ). 这 个 例 了 显示 了 如 何 用 确定 模 
卉 的 图 形 来 模仿 一 个 随机 结构 的 纳 迹 . 为 了 检验 在 一 个 含有 空气 容器 中 源 浮 着 的 
水 晶 纤维 上 微小 镜 南 的 布朗 运动 的 斯 莫 鲁 切 斯 基 (Smoluchowski) 理论 ，1931 年 
开 普 著 进 行 了 一 个 有 创造 性 万 的 实验 ,从 而 得 到 了 微小 镜面 运动 拱 迹 的 照片 .下 
图 为 每 30 秒 广 生 的 轨迹 的 Bi. 























时 up ( 秒 } 


在 观察 这 个 图 形 时 , 卡 克 评论 到 “很 难 摆脱 这 样 的 印象 , 即 这 就 是 偶然 性 具 
体 化 的 表现 ,而 甩 只 有 随机 化 结构 才能 产生 出 这 样 的 轨迹 ," 开 普 勒 的 实验 可 几米 
验证 斯 鲁 莫 切 斯 基 的 理论 , 空气 的 分 于 随机 地 碰撞 镜 而 , 实验 所 给 出 的 镜面 移动 
的 图 形 具有 平稳 启 斯 过 程 的 特征 . 

RTE, HE à BK, 并 适当 选取 数列 2， ,2,，…,4, 和 尺度 因子 a, M 
函数 

cosa t + coss t tin + cosA,t 


vn 


BOSAL PE JC SELLA BELT SAT, BIA BE ERE JT 2S Bh PAE A FE (REIR. 卡 
克 提 出 : 到 底 什 么 是 偶然 性 ? 


A2 创造 性 


EDEL SEIT OFS IT KX (Ghosh) 博士 给 我 如 下 的 评论 . 

“关于 创造 性 , 总 是 存在 着 基 种 神秘 和 令 人 敬 展 的 东西 . 在 20 世纪 里 ,没有 
比 对 拉 曼 纽 扬 的 工作 更 具有 神秘 感 和 敬 情 感 的 了 .创造 性 行为 即 新 思想 和 新 发 现 ， 
考虑 到 创造 竹中 这 种 神秘 欠 素 的 木质 ,劳教 授 正 存 思考 随机 性 是 寿 是 创造 性 的 一 
个 重要 部 分 .事实 上 , 为 了 班 解 创造 性 , 芭 教 授 提出 了 个 新 的 尝试 性 的 构想 .这 
E, 让 我 引用 他 的 原文 : “显而易见 ,创造 性 的 一 个 必要 条 件 是 让 思维 不 受 已 有 知 
识 或 成 形 的 规则 所 柬 缚 ,让 其 能 自由 地 思考 .或 许 产生 新 发 现 之 前 的 思考 仅仅 是 
一 个 模糊 的 形式 ,中 随机 搜索 相互 作用 的 一 次 成 功 -这 种 随机 搜索 可 找 出 一 些 新 的 
框架 来 ,与 过 去 的 经 验 和 潜在 的 意识 一 化, 从 而 缩小 新 发 现 可 能 产生 的 范围 ， 或 
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Vr, 甚至 随机 搜索 本 身 也 是 下 意识 的 ,已 经 多 次 证 明 很 多 创造 性 的 工作 是 在 一 种 
下 意识 状态 下 完成 的 ， -个 极 好 的 说 明 是 哈 德 蕊 德 的 “ 论 创 造 发 明 的 心理 学 ” 
(Hadamard, J. 选 白 《数学 领域 ) 一 书 , 普 林 斯 贺 ,Dover,1954). 但 是 , 通过 概率 论 
的 论述 米 度 景 随机 性 和 不 确定 性 慨 念 是 极 好 的 附加 假设 . 哈 德 马 德 的 文章 中 含糊 
WER TERE, 但 是 没有 引起 太 大 的 注意 . 可 能 , 这 足 通 过 对 拉 曲 纽 扬 的 几 平 
是 魔术 般 的 令 人 眼花 洪 乱 的 能 力 的 审视 ,以 及 对 将 机 性 和 不 确定 性 巧妙 地 加 以 总 
结 , 劳教 授 给 我 们 引出 的 中 心 议题 .下 面 的 论述 都 紧 扣 着 这 一 主题 . 

在 我 看 来 ， 当 大 们 在 懒 目 纳 式 的 跳跃 或 者 身 处 重 览 的 学 习 过 程 中 时 , 总 是 存 
FLA RRR TNA. 由 此 可 以 得 到 两 个 结论 .第 1， 尽管 有 很 多 努力 ， 
特别 是 维基 (Viennese) 学 派 的 努力 ,但 至 少 有 关 创 造 性 的 神秘 性 的 -部 分 是 与 缺 
莹 对 了 1 纳 法 的 适当 的 暂 学 基础 有 关 的 . 这 些 努 力 均 被 轻薄 地 描述 为 就 像 妄图 要 从 
一 个 非常 小 的 1 袋 中 取出 一 只 大 猫 .第 2,， 对 创造 性 的 神秘 感 也 是 与 对 人 工 智 能 的 
学 习 缺 乏 满 意 的 模型 有 关 . 鉴于 此 ,这 时 值得 提出 第 3 点 . 据 我 所 知 ,对 学 习 的 模 
翅 ， 至 少 是 适合 学 习 的 模型 ， 仅 有 随 忆 横 型 (概率 模型 ). 这 样 看 来 劳教 授 的 构想 
BRERA, 但 起 这 样 的 模型 化 在 逻辑 论述 上 还 没有 达到 一 定 的 程度 .如 果 
有 人 入 试 着 利用 计算 机 来 进行 创造 性 的 工作 ， 即 模拟 创造 性 ,我 认为 这 是 目前 惟一 
可 行 的 方法 .我 想 ,利用 计算 机 所 产 牛 的 音乐 是 省 就 属于 这 一 类 型 . 

然而 , 这 样 的 模型 要 达到 怎样 的 程度 才 是 满意 的 、 能 够 说 明 问题 和 可 以 接受 
HUB? 关上 这 -- 点 ,我 想 提 及 一 下 和 希 尔 伯 特 的 数学 观点 . 今天, 作为 数学 基础 被 完 
全 埋 解 并 部 知 的 是 希 尔 伯 特 的 有 限 彤 式 主义 学 说 和 证 德尔 的 不 完全 性 定理 中 .( 存 
在 一 些 乐 观 的 例外 , 如 参见 Nelsen, Sankhya, A, 1985.) 就 像 门 纳 法 一 样 , 由 于 过 
于 复杂 ,创造 性 难以 产 牛 诸如 不 完全 性 定理 这 样 的 结果 . 这 里 谈 到 的 不 完全 性 仅仅 
指 的 是 在 严格 定义 的 算法 之 上 的 .然而 ,人们 也 可 能 找 出 这 样 的 例子 来 说 明 在 某 
种 意义 下 ,给 定 的 模型 十 反 二 观 的 . 这 时 ,与 “反例 ”一 起 考虑 这 个 模型 会 帮助 人 们 
更 好 地 掌握 被 模型 化 的 事物 的 本 质 .我 认为 关于 劳教 授 的 构想 的 反例 是 存在 的 , 作 
为 一 种 辩证 ,这 里 仅 引 用 劳教 授 本 人 所 引用 过 的 爱 因 斯 坦 的 段 叙 述 :“ 然 而 , 我 
的 这 种 确信 并 不 能 基于 某 种 逻辑 推理 ,只 能 以 我 个 人 不 多 的 经 验 来 说 明 ." 戈 土 博 
士 结束 他 的 评论 时 说 :”' 我 不 知道 我 的 这 种 关于 创造 性 的 观点 是 否 是 属于 波 帕 流 
派 的 .我 也 不 知道 波 帕 关于 科学 的 观点 是 侍 是 以 用 于 创造 性 ."” 

我 感谢 变 士 博 上 对 很 有 争议 的 创造 性 概念 提出 的 一 些 基 本 论点 . 我 把 自己 关 
于 创造 性 的 回答 限制 在 科学 方面 ,这 也 洗 不 同 于 音乐 ,文学 和 艺术 中 的 创造 性 吧 















































CD 好 德尔 ,奥地利 数学 家 (1906 一 1978).1931 年 证 明了 形式 数论 不 完全 性 定理 ,否定 了 着 
尔 伯 特 学 说 的 蘑 些 设想 ,对 自然 数 集 二 递归 论 的 产生 和 发 展 右 重要 影响 ,并 有 重要 的 哲学 意 
义 , 一 一 译 者 注 
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Chl Chandrasekhar, “Yb HC 3E. , 4: FI N E 2E PA eie 355", Nora and Edwary 
Rayerson YPE , 1975) 在 科学 方面 , 迄今 为 下 所 做 的 研究 大 部 分 只 十 作 完成 下 作 
的 水 平 上 ， 或 是 堵塞 一 个 漏 润 ,或 是 填补 -个 坑 . 人 研究 中 只 占 很 小 比率 部 分 吕 被 
e E t 一 种 是 在 已 存 
AEREA: 另 一 种 具有 更 高 的 水 半 , 涉及 到 现 有 框架 的 变动 也许 人 们 还 
THE TAAA T DONE ALA 构 ,但 - 般 可 以 认识 到 有 关 这 个 结构 
的 几 个 方面 : 思想 不 受 逻 辑 演绎 过 程 束缚 的 潜意识 由 维 ， 偶 然 的 发 现 , 把 某 个 领 
成 内 已 有 的 经 验 移 植 到 乍 看 起 来 不 同 的 领域 , 甚至 对 美丽 和 时 尚 所 共有 的 美感 
下 面 引用 … 些 关于 创造 性 的 论述 . 
为 了 进行 发 明 ,， 人 们 必须 抛 开 昌 有 的 去 思考 . 
H A (Souriau) 
人 们 有 时 所 发 现 的 并 不 是 他 们 要 寻找 的 、 
ARICA. Fleming) 
我 没有 刻意 寻 砚 而 是 去 发 现 . 
毕加索 (Picasso) 
我 的 工作 总 是 试图 把 真实 和 美 抒 合 在 一 起 ;但 是 当 我 不 得 不 选择 其 
中 之 一 时 , 我 通常 选择 美 . 
BURCH. Weyl) 
很 旱 以 前 我 就 知道 那些 结果 ， 可 是 我 不 知道 怎么 才能 得 到 它们 . 
TCI. Gauss) 
我 不 做 任何 设想 . 
牛顿 (I. Newton) 
我 已 经 说 过 了 ,科学 没有 信念 不 行 .…… Ja 5 3€ 3E, TP HEAR 5 GE. 
3E, 与 其 说 是 我 们 可 以 证 明 的 ,不 如 说 是 我 们 可 以 基于 此 而 行动 , 而 所 
基于 的 行动 是 信念 最 高 的 断言 ,…… 科 学 是 人 生 的 一 种 方式 , 仅 当 人 们 
自由 地 具有 信念 之 时 才 可 繁荣 . 





维 纳 (N. Wiener) 

出 上述 所 引用 的 论述 可 知 ,在 创造 性 科学 的 最 初始 阶段 存在 着 某 种 神秘 因素 . 
- 些 哲 学 家 已 经 讨论 过 创造 性 的 基础 , 但 是 并 没有 过 多 说 明 这 种 神秘 因素 . 

针对 苹 士 博士 提 到 的 波 帕 的 观点 ,我 想 做 如 下 说 明 , 波 帕 关于 科学 假说 单纯 
是 一 些 猜测 的 论述 ， 只 能 解释 为 他 是 指 由 观测 得 来 的 事实 所 得 到 的 假设 没有 明确 
的 算法 . 波 帕 的 论点 , 即 .` 个 假设 不 能 被 接受 就 只 能 是 担 造 的 ,或 许 含有 很 深 的 哲 
学 意义 , 但 在 严格 的 意义 下 这 种 说 法 是 不 当 的 . 事实 上 ,科学 法 则 被 成 功 地 应 用 于 
实际 . 波 帕 并 没有 附 上 任何 关于 如 何 江 成 假说 的 重要 性 .或许 是 因为 即使 提出 这 样 
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的 问题 也 没有 逻辑 性 的 答案 吧 . 

我 相信 ,影响 科学 的 都 些 科 学 法 则 并 不 是 仪 仪 建立 在 已 有 知识 之 上 或 是 从 已 
ATARI SE RS. FEET George Bernard Shaw) HUGE BA, A ET BE “AE AR I ET E 
EASES, MLE MTA IE , AUT EE SED ee EE A A HE, R 
曾 提 议 把 随机 思考 作为 创造 性 的 归 素 . 人 的 大 脑 为 解决 此 个 问题 而 密集 活动 的 阶 
段 ,“ 这 时 所 有 的 脑 细胞 邦 伸展 为 极限 状态 ”, 脱 离 惯例 思想 的 随机 思考 或 许 是 要 找 
出 最 可 能 解 所 必须 的 .这 并 不 意 昧 搜索 一 个 解 是 从 有 限 个 可 能 的 解 的 集合 中 通过 
随机 检验 并 纠 错 来 得 到 的 . 创造 性 过 程 中 , 所 谓 可 能 的 解 事先 是 未 知 的 ,而 此 也 可 
能 不 是 有 限 个 .我 这 里 提 到 的 是 创造 性 过 程 的 最 后 阶段 ,这 时 基于 先前 选择 所 得 到 
的 知识 逐步 进行 最 佳 选择 , 峭 小 可 能 搜索 的 范围 占 到 相信 出 现 一 个 合理 的 选择 . 
这 是 一 个 逐渐 驱散 恩 暗 的 过 程 (或 许 是 - -个 随机 过 程 ), 而 不 是 要 从 F 能 的 儿 户 稿 户 
中 选择 打开 哪 一 扇 使 其 能 射 人 最 多 的 光亮 .然而 ,有 些 科 学 家 相信 计算 机 能 够 用 于 创 
造 新 知识 . 

创造 性 到 什么 程度 能 够 被 机 械 化 .程序 化 呢 ? 在 科学 发 现 的 背景 里 ,一 些 实 
验 研 究 已 经 说 明 , 一 个 科学 发 现 , 无 论 它 足 否 是 一 次 革命 ,都 是 在 正常 问题 解决 的 
过 程 中 出 现 的 ,并 不 包含 诸如 "创造 的 火花 " “才气 的 内 埋 "和 " 罕 然 的 洞察 力 ”-- 类 的 
神秘 成 分 . 既然 如 此 ， 估 们 就 可 以 相信 创造 性 十 信息 处 理 的 结果 , 因而 可 以 程序 化 . 

最 近 由 Pat L, Herbert AS, Gary L B # Jan M Z 出 版 的 一 本 名 为 《科学 发 现 》 
《创造 过 程 的 计算 机 探索 ，MIT Press, Cambridge, 1987) 的 专著 讨论 了 发 现 的 分 
类 , 以 及 以 信息 处 理 为 日 的 ,在 “发 现 问 题 "“ 相 关 数 据 的 识别 "和 “由 启发 式 来 进 
行 选择 搜索 ”等 涉 太 创造 性 主要 因素 方面 讨论 了 编写 计算 机 程序 的 可 能 性 .他 们 给 
出 了 几 个 例子 来 说 明 过 去 时 代 的 儿 个 证 要 发 坝 , 在 仪 利用 这 些 发 现 当时 的 信息 和 
知识 条 件 下 ,能 够 由 计算 机 程序 更 有 效 地 再 现 其 结果 . 作者 们 希望 ,他 们 用 于 解决 
问题 的 理论 将 提供 探索 可 能 引出 新 的 研究 领域 其 至 结构 变动 那样 结果 的 程序 . 作 
者 们 在 结尾 时 谈 到 : 

我 们 愿意 想像 那些 伟大 的 发 明 家 ,那些 我 们 正在 试图 理解 他 们 行为 

的 科学 家 们 会 高 兴 我 们 把 他 们 的 活动 解释 为 正常 的 [虽然 是 高 质量 的 ) 人 

类 的 思考 .…… 科学 所 关心 的 是 既 存 的 世界 ,并 不 关心 我 们 所 希望 的 世 

界 如 何 . 因此 我 们 必须 在 无 休止 的 总 是 保持 魅力 的 启发 式 搜索 中 不 停 地 

进行 新 的 实验 ,获得 新 的 证 据 的 引 村. 


爱 因 斯 坦 对 于 科学 的 李 质 提出 了 类 似 的 观点 : 


仅 有 纯粹 这 辑 性 地 思考 并 不 能 使 我 们 产生 经 验 世 界 的 知识 . 所 有 实 
际 的 知识 是 从 经 验 开 始 并 以 经 验 站 束 的 . 由 纯粹 去 辑 性 所 得 到 的 那些 命 
题 实际 上 完全 不 存在 . 
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E EDR. Penrose) 在 他 的 《皇帝 
程 中 的 作用 ， 


确信 计算 机 决 不 能 复制 思考 . 


A.3 


讨论 
自然 事 


偶然 性 和 必然 性 
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Æ, 则 


第 上 章 AEE ,随机 性 与 新 知识 的 创立 





的 新 思想 》 ` 书 帆 强 请 了 思考 在 创造 性 过 


由 于 那些 不 能 由 计算 而 由 我 们 思考 所 得 到 真理 的 明确 的 事实 ,使 我 


提出 了 有关 原 因 、 效 永和 偶然 性 的 产 牛 的 问题 , 由 纳 起 来 为 “你 强调 
件 的 不 确定 性 .那么 ,如果 各 件 的 发 生 部 是 随机 的 ,我 们 如 何 了 解 、 蓉 索 和 


我 很 尚 兴 大 家 提出 这 样 的 问题 .如果 自然 办 中 的 事件 完全 不 可 项 测 有 地 随机 发 
人 们 的 生活 将 是 无 法 拒 受 的 . 而 与 


j 此 相反 ,如 果 每 一 件 事 帮 起 确定 的 、 完 


可 以 预测 的 , 则 生活 将 会 是 无 趣 的 .现实 中 的 每 现象 是 二 者 个 规则 的 混合 , (就 


像 上 府 曼 经 常 所 说 的 那样 . ) 这 使 得 “和 

利用 央 果 关系 原理 来 解释 所 观测 到 
利 实际 上 的 内 难 . 

BERE CE, 这 是 
上 .假设 和 是 A 的 原因 , 则 有 可 能 要 | 
ARE A, 的 原因 呢 ……. 我 们 有 可 能 得 到 
找 一 个 点 内 会 变 得 很 
在 逻辑 上 甚至 是 不 可 能 的 . 

实际 中 ,除了 非常 明 如 的 情形 外 , 3 

















大 量 的 因素 ) .例如 ,如 果 你 想 知道 投 据 - 


E), 那 你 必须 了 解 有 关 的 玫 个 内 子 : 
Buen pn de SEHE Ceu), ERRA 
Uem ， 以 及 由 这 些 因子 所 决定 的 事件 (y 

y= fin, 
如 果 不 知道 了 的 确切 形状 ,如果 所 有 内 


活 变 得 复 条 但 不 案 然 无 味 ”， 
的 现象 各 预测 将 来 的 事件 时 存在 着 逻辑 的 





因为 我 们 最 后 所 得 到 的 结局 是 处 在 一 个 复杂 的 因果 关系 链 


1 


FALE A, 的 原因 . IEE A, ABA A 
-个 没有 穷尽 的 链 ,而 且 在 某 个 阶段 要 了 


难 ,要 人 们 人 在 这 个 阶段 上 通过 偶然 作 结构 来 模型 化 事 作 这 


起 一 个 事件 的 原因 会 有 无 限 多 (或 有 限 代 
^it ff RO Ss HRS MR E rd COM ) at Re st 
FY Seah FE AIL HAAN, 如 
POU SE Cra), RUE DAR TD HI HHE C25), 
) ke IE RGR IEP e XE 


X) d.c) 


dox. ry HAASE, ri HL 





果 存 在 测 鞭 误差 , 那么 就 会 产生 不 确定 性 . 我 们 或 许 仅 可 以 从 其 些 因子 上 ,假设 


Xi 


y= filers Ta 
米 模型 化 结果 y, 这 里 f, JES 的 一 个 近 
困 子 和 测量 误差 的 完全 信息 所 引起 的 本 


az ey. et, 上 获得 信息 ,这 迫使 我 


们 通过 

uog,) be 

似 值 , e 是 由 于 天 的 选择 以 及 缺 筷 对 其 他 
知 的 误差 .这 时 我 们 有 必要 通过 一 个 偶然 


Bae 


性 结构 来 对 选 拌 f, 以 及 由 此 所 带 来 的 误 益 e 所 产生 的 不 确定 性 进行 模型 化 . 
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什么 是 偶然 性 y 如 何 对 它 进 行 模型 化 ? 我 们 如 何 综合 那些 由 已 知 原 因 所 得 到 














的 结果 和 由 术 知 原 
件 呢 ? 当 存在 不 确定 











可 能 带 来 的 都 些 结果 ,去 解释 所 观测 的 现象 或 预测 将 来 的 事 


性 时 ,要 "解释 一 个 现象 "和 "项 测 个 事件 "对 我 们 来 说 意味 


着 什么 呢 ? 的 确 , 要 回答 这 些 问 题 存 在 着 逻辑 上 的 困难 . 如 果 我 们 模型 化 不 确定 
TE, 则 在 模型 化 不 确定 性 的 过 程 中 自然 会 产生 模型 化 不 确定 性 的 问题 .我 们 可 以 
把 这 些 哲 学 论点 故人 在 - 边 , 侧 把 对 一 个 现象 的 解释 作为 一 个 本 使 用 的 假设 (并 不 


一 定 为 真 ) 并 由 此 在 可 容许 的 误差 范围 内 导出 结论 . 


这 方面 最 初 的 尝试 是 误 益 理论 的 发 展 ,在 解释 结果 (估计 末 知 量 以 及 验证 假 
设 ) 时 必须 考虑 测 虹 中 的 不 确定 性 . 共 次 就 足 由 支配 某 个 物理 系统 的 偶然 性 法 则 来 


特征 化 所 观测 的 现象 .可 能 这 是 在 人 类 思 








和 对 白 然 输 的 了 解 中 所 取得 的 最 伟大 


的 进步 ，- 个 显著 的 例 了 是 孟 德 水 的 研究 上 作 . 蒜 今 120 年 以 前 , 科学 历史 中 是 孟 
德尔 第 一 个 介绍 了 “ 非 确定 性 的 结构 ”. 出 观察 受 随 机 变动 影响 的 数据 , 负 德 尔 葛 定 





了 遗传 学 即 遗 传 结构 的 基础 , 卫 德 尔 的 思想 , 即 “ 偶 然 性 和 必然 性 的 交融 





各 个 


变化 阶段 的 偶然 性 利 可 选择 的 必然 性 的 父 融 "导致 产 牛 现代 进化 理论 . 问 时 打开 了 
通过 基本 粒子 的 随机 游 劲 米 解释 物理 坝 象 的 突破 口 . 实 际 上 ,偶然 性 的 概念 已 经 


帮助 独 开 了 那些 认为 没有 原因 所 产 牛 的 事件 背后 的 神秘 感 ， 





更 进一步 , 在 任何 给 出 的 情形 如 日 常生 活 、 科 学 研究 .工业 生产 或 复杂 决策 
中 ,我 们 已 经 学 会 处 理 所 出 现 的 偶然 性 .我 们 已 经 发 展 了 各 种 方法 从 被 偶然 事件 
(噪音 ? 牌 曲 了 的 通信 中 提取 信号, 通过 到 馈 和 控制 (控制 论 , 有 自动 控制 系统 的 装 
置 ) 来 减少 偶然 性 的 影响 .我 们 已 经 设计 了 与 偶然 性 和 谐 共处 的 方法 ,尽管 偶然 性 
的 影响 存在 ,这 些 方法 也 能 使 我 们 有 效 地 工作 (使 用 误差 修订 符 ; 为 了 获得 一 致 性 
的 估计 量 进行 反复 试验 ; 引进 宛 余 以 便 能 容易 进行 识别 , ) ,所 有 这 些 最 令 人 惊奇 的 


是 : 我 们 已 经 能 够 利 





















































偶然 性 (蒙特 卡 罗 法 ， 随 机 搜索 ) 来 解决 那些 其 他 方法 难于 














解决 的 问题 ,以 及 能 够 利用 偶然 性 来 进行 改良 (利用 繁殖 程序 的 选择 ). 为 了 握 高 机 
器 的 性 能 , 技术 人 员 在 设计 机 器 时 有 时 会 遵 慎 地 结合 进 偶然 性 的 因素 . 最 反常 的 


是 : 为 了 提供 有 效 的 




















和 无 偏 的 信息 ， 在 收集 数据 时 (如 样本 调查 和 实验 设计 时 )， 





我 们 已 经 人 为 地 导 人 了 偶然 性 的 因素 . 





MERE | 


REPATHA aL HTP AE BO SR Le HUN HU D 


(R. Roy) 4-8 X ETAM SES) (Experimenting with Truth, p. 188) PER à: 
为 了 使 我 们 生活 中 一 切 能 遵循 正 态 分 布 " 的 铃 型 曲线 ,共同 体 和 国 
家 一 级 的 社会 计划 必须 进行 不 同 的 设计 便 对 应 相应 的 场合 ， 


他 认为 , 一 个 有 远见 的 政治 结果 或 许 是 废除 由 (自荐 ) 候 选 人 活动 的 选举 过 程 ,而 由 
人 民 直 接 投 票 从 那些 有 资格 的 人 的 集合 中 引 人 随 机 方法 (抽签 法 ) 进 行 选择 . 


这 里 , 我 想 引 用 


世界 上 仅 有 有 的、 设 在 俄 岁 斯 的 随机 研究 所 所 长 拉 售 特 力 金 
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CRastrigin) E fh cfr SCR R , PARRER CRT C The Chaney, Chancy World) 中 的 
一 段 话 ; 
对 引 人 注 目的 有 关 惕 然 性 世界 的 研究 仅仅 才 是 一 个 开始 .对 发 生 种 

种 奇异 并 只 无 限 洁 力 的 这 个 世界 ,到 目前 为 止 科学 研究 才 仅 仅 掠 过 其 表 

皮 .但 是 , 对 偶然 性 这 个 无 价 之 宝 的 发 握 已 经 开始 , 现在 还 无 法 说 是 什 

么 样 的 财富 将 被 开发 出 来 . 然而 有 一 点 是 确认 的 : 我 们 将 不 得 不 习惯 于 

思考 惕 然 性 ,不 是 作为 使 人 恼火 的 障碍 物 , 也 不 是 作为 一 种 “对 现象 的 非 

本 质 的 附加 物 "( 犹 如 某 哲 学 字典 所 言 )， 而 是 作为 一 种 不 能 预知 的 具有 

最 大 胆 的 想像 的 有 无 限 可 能 的 源泉 来 加 以 认识 ， 


如 皇 我 们 要 谈论 日 然 界 中 任意 合 旺 的 庶 理 , 则 这 个 原理 只 能 是 偶然 性 : 因为 当 侦 
然 性 与 选择 … 起 作用 时 , 它 便 构 成 了 自然 界 的 “道理 ”没有 侦 然 性 ,进化 和 改良 
都 是 不 可 能 的 . 


A.4 模糊 性 


除了 我 们 已 经 讨论 过 的 偶然 性 利 随机 性 以 外 , 在 解释 观测 数据 时 还 存在 着 另 
一 个 障碍 -这 就 是 在 识别 物体 (包括 人 、 位 置 场所 或 事物 ) 所 属 不 同类 别 时 存在 着 的 
异 糊 性 .我 是 “个 统计 学 家 ,还 是 一 个 数学 家 ,或 者 已 一 个 管理 者 ? 在 不 同 的 情形 
下 我 也 许 给 出 不 同 的 答案 .偶尔 ,我 也 许 会 说 我 是 各 占 王 分 之 .当然 ,为 了 避免 
在 交流 思想 和 调查 研究 工作 中 引起 混乱 ,最 基本 的 是 要 尽 可 能 准确 二 定义 分 类 .但 
是 ,在 引 人 概 念 和 给 出 定义 时 ,模糊 性 是 不 本 避免 的 .“ 根 本 的 困难 是 ,不 存在 神灵 
指明 的 方法 来 建立 分 类 ,也 没有 和 多少 是 由 人 来 确定 的 . "(Kruskal, 1978, 私 人 谈话 ) 
我 相信 , 数学 中 研究 “模糊 集 " 的 需要 是 从 物 休 分 类 识别 的 模糊 性 中 产生 出 来 的 . 

然而 , 有 趣 的 是 我 们 注意 到 列 维 (EE，Levi) 在 他 1949 年 出 版 的 论 合法 推理 的 
经 典 著作 中 ， 详 细 地 写 下 了 在 法 庭 和 立法 中 模糊 性 所 起 的 重要 作用 .Kruskal 
《1978) 从 列 维 的 书 中 引用 了 下 询 语 名 来 加 强 上 面 的 论述 . 


为 了 元 许 提出 新 的 观点 ,法 律 过 程 中 所 用 到 的 分 类 必须 保留 一 定 的 
模糊 性 , (第 4 X) 

对 一 种 法 规 来 说 ,如 果 清 楚 地 写 明 了 它 就 完全 可 以 不 含 模糊 性 而 只 
可 应 用 村 某 一 特殊 的 情形 ,这 仅仅 是 一 种 情况 . 然而, ERE, SHR 
法 一 样 ， 法规 和 完 法 中 ,都 不 可 避免 地 存在 模糊 性 .( 第 6 页 ) 

[立法 机 关中 的 错 糊 性 ] 不 是 像 通常 所 言 的 是 由 于 未 成 熟 的 法 令 的 起 
ER 其 至 在 没有 争议 的 情形 下 ,也 不 会 完全 清楚 什么 是 已 经 决定 
fee 在 得 到 关于 如 何 处 理 已 有 案件 的 一 致 性 的 结论 之 前 ,模糊 性 [是 必 
要 的 ].( 第 30 一 31 30) 























附 :讨论 2 





这 是 仅 有 的 一 类 系统 ,其 可 以 在 人 们 完全 没有 统一 认识 以 前 进行 工 
Ape 语言 将 转变 为 接受 社会 所 给 与 的 内 容 . (第 104 页 ) 
因此 , 对 列 维 博 |: 来 说 , 模糊 性 不 是 不 可 思议 的 怪物 ， 而 是 对 社会 的 凝聚 有 益 用 
BRAD. 
ERR RINE A EL ES EE RI D UT EAE AR, EE RB 
的 事物 不 可 项 测 ， 人们 交流 时 所 使 用 的 术语 没有 惟一 的 解释 . 过 去 , 这 些 被 认为 是 
无 法 着 手 处 理 的 障碍 . 今天 我 们 不 仅 把 它们 作为 不 可 避免 的 来 接受 并 进行 学 习 研究 ， 
而 年, 或 许 更 重要 的 是 ,我 们 还 把 偶然 性 和 模糊 性 考虑 为 社会 进步 的 基本 因素 ! 














ALS 的 小 数 点 后 的 位 数 是 随机 的 吗 ? 


《国际 统计 评论 杂志 1996 年 64 卷 第 329 一 344 页 土 发 表 了 Y. Dodge HB x 
长 达 4000 年 古 名 历史 的 文章 ,文中 同时 提出 x 的 小 数 点 后 的 位 数 是 否 形成 -- 随 机 
序列 的 问题 . 从 技术 上 来 说 ,符号 的 随机 序列 是 一 种 不 能 由 比 其 自身 更 简短 形式 来 
记录 的 序列 . 在 这 样 严 格 的 意义 下 ,x 的 小 数 点 后 的 位 数 并 不 形成 -个 随机 序列 .有 
趣 的 是 ,人 们 正在 利用 计算 机 由 下 向 拉 曼 纪 扬 的 神秘 公式 求 x 的 小 数 点 后 的 位 数 : 


4) (1) (3 
Lis MI IAEA + 26390n)( gy)" 


然而 的 小 数 点 后 的 位 数 可 以 描述 为 伪 随 机 数 ,其 满足 所 有 已 知 的 随机 性 统 
计 检 验 . 这些 x 的 小 数 点 后 的 位 数 可 以 用 于 模拟 侠 究 雁 而 导出 有 价值 的 结果 ,这 些 
结果 与 利用 抽奖 法 随机 产生 的 数 所 得 到 的 结果 一 样 好 . 

表 1.4 中 给 出 n 的 小 数 点 后 1000 位 数 中 .这 1000 个 数 中 0,1, 7,9 出 现 的 频 
BAMA: 


数字 0 1 2 3 4 5 6 7 8 9 


WMA 100 100 100 100 100 100 100 100 100 100 


检验 观察 频数 与 其 期 望 值 偏离 程度 的 卡 方 统计 景 的 值 为 4. 20, 这 个 值 小 于 自由 度 
为 9 的 卡 方 检验 临界 值 . 这 就 表明 观察 频数 与 期 望 值 很 接近 . 另 - -种 检验 是 考虑 小 
数 点 后 五 位 数 一 组 的 集合 中 奇数 的 个 数 ,其 结果 如 下 : 


全 有 报道 说 -个 12 岁 的 中 国 男孩 张磊 (音译 ) 在 25 分 30 秒 内 能 背诵 x 的 小 数 点 后 头 4000 
fx. 
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0 1 
7 31 
6.25 31.25 


54 
62.5 


3 4 
61 4l 
62.5 31.25 


6.25 


检验 频数 与 期 望 值 一 致 的 卡 方 值 为 4. 336, 小 于 自由 度 为 5 的 下 方 检验 临界 
值 .的 小 数 点 后 的 数列 看 起 来 与 前 面 第 1.2.1 节 中 表 1. 18038 1.2 所 列 出 的 生 
男 与 生 女 或 抽出 站 球 和 黑 球 的 随机 序列 具有 相同 的 性 质 . 
表 1.4 天 的 小 数 点 后 头 1000 位 数 





1415926535 
5820974944 
8214808651 
4811174502 
4428810975 
4564856692 
7245870066 
7892590360 
3305727036 
0744623799 
9833673362 
6094370277 
0005681271 
1468440901 
4201995611 
5187072113 
5024459455 
7101000313 
5982534904 
1857780532 


8979323846 
5923078164 
3282306647 
8410270193 
6659334461 
3460348610 
0631558817 
0113305305 
5759591953 
6274956735 
4406566430 
0539217176 
4526356082 
2249534301 
2129021960 
4999999837 
3469083026 
7838752886 
2875546873 
1712268066 


2643383279 
0628620899 
0938446095 
8521105559 
2847564823 
4543266482 
4881520920 
4882046652 
0921861173 
1885752724 
8602139494 
2931767523 
7785771342 
4654958537 
8640344181 
2978049951 
4252230825 
5875332083 
1159562863 
1300192787 


5028841971 
8628034825 
5058223172 
6446229480 
3786783165 
1339360726 
9628292540 
1384146951 
8193261179 
8912279381 
6395224737 
8467481846 
7571896091 
1050792279 
5981362977 
0597317328 
3344685035 
8142061717 
8823537875 
6611195909 


6939937510 
3421170679 
5359408128 
5493038196 
2712019091 
0249141273 
9171536436 
9415116094 
3105118548 
8301194912 
1907021798 
7669405132 
7363717872 
6892589235 
4771309960 
1609631859 
2619311881 
7669147303 
9375195778 
2164201989 
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一 一 统计 学 的 发 展 


那些 默 歌 无 闻 的 统计 学 家 们 已 经 改变 了 我 们 的 世界 ，- 一 不 是 由 发 

现 新 的 事实 或 技术 , 而 是 政变 了 我 们 推理 和 试验 的 方法 ,以 及 我 们 对 这 
个 世界 的 观念 的 形成 方式 . 

哈 克 英 (Hacking) 


2.1 早期 历史 : 作为 数据 的 统计 学 


统计 学 思想 远古 即 存 , 但 作为 - - 门 学 科 却 历史 很 短 .统计 学 的 起 源 可 以 追溯 
到 人 类 的 原始 时 期 , 但 是 直到 近代 才 逐 渐 成 为 一 门 实际 应 用 中 极为 重要 的 学 科 . 
SR, 尽管 对 统计 学 的 基础 和 方法 论 仍 存在 着 种 种 争论 ,统计 学 已 成 为 一 门 活 吧 
的 被 广泛 应 用 的 学 科 . 不 同 的 统计 学 流派 已 经 提出 了 各 种 时 尚 的 统计 学 方法 .在 数 
据 分 析 更 广泛 的 领域 内 ,计算 机 的 出 现 对 统计 学 方法 论 的 发 展 产生 着 相当 巨大 的 
影响 . 我们 不 清楚 将 来 统计 学 的 发 展会 怎么 样 .这 里 我 将 对 统计 学 的 起 源 做 一 个 概 
R, Wie HAUT BUY RIES ENA. 


2.1.3. 什么 是 统计 学 


像 物理 、 化 学 .生物 及 数学 那样 ， 统 计 学 是 一 门 单独 的 学 科 玛 ? 物理 学 家 研究 
的 是 如 热 光电、 运动 规律 那样 的 自然 现象 . 化 学 家 测定 物质 的 组 成 及 化 学 元 素 之 
间 的 交互 作用 . 生物 学 家 研究 植物 和 动物 的 生活 .数学 家 贡 在 给 出 的 假定 之 下 沉 滑 
于 他 自己 推演 各 种 命题 的 游戏 . 这 些 学 科 中 的 每 一 门 都 有 它 自 己 的 问题 ,而 且 有 解 
决 这 些 问题 的 各 自 的 方法 , 各 学 科 为 此 而 成 为 一 门 单独 的 学 科 . 在 这 种 意义 下 , 统 
计 学 是 一 门 单独 的 学 科 吗 ? 存在 着 统计 学 意欲 解 决 的 纯 统 计 学 的 问题 吗 ? 如 果 回 
答 是 否定 的 , 那么 统计 学 起 可 以 用 来 解决 其 他 学 科 问 题 的 某 种 艺术 或 是 逻辑 或 是 
BAG? 

此 十 年 以 前 , 统计 学 这 个 词 既 没有 被 经 常 使 用 也 没有 得 到 充分 理解 ,还 常常 
章 到 怀疑 .除了 政府 部 门 内 为 了 行政 上 的 目的 收集 必要 的 数据 和 制作 表格 而 雇用 
的 少数 人 外 ,没有 被 称 为 统计 学 家 的 专业 人 员 . 高 等 学 府中 也 没有 为 设置 统计 学 学 
科学 位 而 开设 的 系统 课程 . 现在 ,情况 已 完全 改变 了 , 人 类 活动 范围 内 的 一 切 领 域 
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部 要 求 统计 学 的 专业 知识 和 技术 .政府 机 关 , 工业 部 门 和 研究 单位 都 雇用 了 大 量 的 
统计 学 家 .人 学 也 开始 把 统计 学 作为 一 门 单独 的 学 科 来 讲授 .所 有 这 些 不 寻常 的 发 
展 , 引出 了 - 连 串 的 问题 : 

统计 学 的 起 源 是 什么 ? 

统计 学 是 -一 门 科学 , 还 是 种 技术 , 或 是 一 门 艺术 ? 

统计 学 的 木 来 会 怎么 样 ? 


2.1.2 早期 记录 
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树木 上 刻 痕 作 为 计算 家 畜 及 其 他 财产 的 一 种 方法 .收集 数据 ,记录 信息 的 必要 性 一 
定 是 出现 在 人 类 放弃 个 体 游牧 生活 状态 ,开始 有 组 织 的 社会 生活 之 时 .古代 人 类 
必须 集中 所 拥有 的 资源 以 便 正 确 地 分 配 使 用 ,而 且 要 计划 将 来 的 需求 .随后 产生 了 
帝制 上 朝 . 有 证 据 表 明 ， 丝 和 界 各 地 前 古代 王朝 的 统治 者 们 都 有 会 计 来 收集 他 们 
家 所 拥有 的 人 口 和 资源 的 详细 数字 . 中国 古代 早期 的 一 个 呈 帝 刘邦 就 认为 统计 很 
E, 因而 他 让 他 的 宁 相 直接 管理 统计 数字 . 这 作为 一 个 传统 ,人 在 中 国 历史 上 延 
续 了 很 长 一 段 时 间 . 他 们 主要 感 兴趣 的 是 : 当 发 生 紧 急 状况 时 能 够 动员 多 少 身 强 
力 壮 的 男子 ; 寡 要 多 少 人 的 劳作 才能 满足 市 民 的 基本 生活 ;在 计划 作出 有 关 财 产 或 
婚姻 法 律 变更 时 ,不 满 的 少数 派 会 有 多 少 ,他 们 拨 占 财富 如 何 ;一 个 地 方 统治 政权 
以 及 邻 国 的 课 税 能 力 、 

现 有 证 据 表明 , 早 全 公元 前 2000 年 左右 的 看 朝 时 期 , 中 国 就 进行 人 [1 调查 
统计 , 周 朝 (公元 前 1111 ~ 前 211 年 ) 为 了 管理 统计 工作 设立 了 “ 司 书 (音译 )" 职 
HE. EET- PA WA THESE 24 章 记载 了 65 个 涉及 到 统治 一 个 国家 的 各 
个 方面 的 问题 .例如 : 多 少 家 庭 拥有 上 自己 的 土地 和 房屋 ?” 每 一 户 储备 有 多 少 粮食 ? 
有 多 少 钙 夫 FA MIL .残废 人 和 病人 ? 

《 旧 约 圣 名 》 的 第 4 册 引 用 了 公元 前 1500 年 左右 的 早期 人 口 统计 结果 ,以 及 
要 摩西 对 以 色 列 军队 进行 调查 统计 的 指示 . 

大 口 统计 CENSUS 这 个 词 本 身 源 出 于 拉丁 诸 CENSERE, 指 税金 . 罗马 的 人 
口 统计 是 由 第 6 世 罗 马 王 图 力 斯 {(S，Tullius, 公元 前 578 一 前 534) 建 立 的 .在 这 个 
建制 下 ,当时 称 之 为 监察 官 (CENSORS) 的 罗 己 官吏 为 了 谍 税 和 决定 能 参战 的 男 
子 人 数 ,每 5 年 负责 做 一 次 人 口 和 财产 的 登记 . 公元 前 5 年 , 古 罗马 皇帝 奥 目 斯 塔 
斯 把 人 口 统计 制 推广 到了 整个 罗马 帝国 .最 后 次 定期 的 罗 己 人 口 统计 是 于 公元 
74 华 进 行 的 .罗马 帝国 吉 亡 之 后 的 几 个 世纪 内 西方 社会 都 没有 留 下 任何 关于 人 口 
统计 的 记录 .今天 我 们 所 知道 的 定期 的 人 口 统计 , 仪 仪 是 从 17 世纪 才 开 始 的 - 

有 趣 的 是 , 今天 在 印度 被 称 之 为 行政 记录 或 官方 统计 的 一 个 非常 完整 的 系统 
在 公元 前 300 年 以 前 就 已 经 形成 . 公元 前 321 — 300 年 之 间 出 版 的 卡尔 特 亚 
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(Kautilya) 的 经 WD BEER C) (Arthasastra) 中 详细 记述 了 应 如 何 收 集 和 记录 整理 
数据 .要 求 村 里 的 会 计 戈 帖 (音译 ) ,保存 村 时 人口 .十 地 使 用 和 农作物 收成 等 的 数 
据 记 录 .《 印 度 经 典 》 中 提 到 的 村 会 计 的 责任 还 有 : 
CRM EAR ,哪些 没有 纳税 ; 不 仅 要 登记 每 一 村 落 中 四 个 等 
级 阶层 居民 的 总 人 数 而 且 还 要 登记 耕 四 人 ,饲养 牛 的 人 、 商 人 、 工 区 、 体 
力 劳动 者 ` 奴 来 和 每 一 户 拥有 的 两 条 彩 和 四 只 脚 的 动物 的 准确 数据 ， 同 
时 确定 从 各 户 能 收集 到 的 黄金 、 无 钴 劳 力 、 税 收 及 罚金 的 数目 - 


近来 , 人 们 已 发 现 印 度 在 伊斯兰 教 统治 时 代 官 三 统计 占 了 很 重要 的 地 位 .这 
个 时 期 最 为 人 熟知 的 出 版 物 称 为 《 阿 卡巴 士 朝 (Ain-i-Akbari) 的 报告 》, 这 是 在 阿 卡 
巴 (Akbar) 皇 帝 统治 下 进行 的 大 规模 的 印度 官方 统计 调查 的 纪录, 这 个 记录 由 他 
BAHE CA. Fal) fE 1596 ~ 1597 年 间 完 成 . 书 中 包含 了 大 量 的 有 关 这 个 伟大 
王朝 的 信息 , 下 面 随员 拍 出 一 些 数 例 : 


3 种 不 同 的 土地 上 31 种 农作物 的 平均 产量 ; 连续 19 年 间 (1560 一 
1561 到 1578—1579)7 个 地 方 的 50 种 农作物 产量 及 价格 的 比率 ; 在 陆 
军 ,海军 中 雇用 的 各 种 劳力 、 包 括 马车 夫 等 的 平均 日 工资 ; 下 列 物品 的 
平均 价格 : 44 种 农作物 及 产品 , 38 种 蔬菜 ,21 种 内 类 野味 ,8 种 好 制 
品 , 油 ,砂糖 ,16 种 调味 料 ,34 种 威 菜 ,24 种 棉 制品 ,39 种 丝 绢 ,30 种 棉 
布 ,26 种 毛 制品 ,92 种 水 果 ,77 种 武器 及 部 件 ,12 RAR, SBD 
+ WF BRED, 304 RAMA 712 种 木材 等 等 、 


谜 一 样 的 是 , 他 们 为 什么 而 且 是 如 何 去 收 集 到 这 样 大量 的 数据 的 , 使 用 了 什么 样 
的 行政 毛 段 , 利用 了 什么 措施 来 确保 数据 的 完整 及 准确 , 以 及 这 些 统计 数据 都 用 
于 什么 目的 . 

















2.1.3 统计 学 与 统计 学 学 会 








统计 学 STATISTICS 这 个 术语 的 问 根 ,在 拉 耳 诸 生 是 国家 STATUS 的 意思 ， 
由 18 世纪 中 星 德 国学 者 艾 奇 纳 沃 (G，、Achenwall) 新 便 出 的 这 个 词 意 为 “由 国家 
来 收集 、 处 理 和 使 用 数据 .” 

1770 年 , M ERRO. von Biclfeld) 在 他 所 著 的 《博学 要 素 》 一 书 中 提 到 , 统 
计 学 是 
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一 门 科学 , 教 给 我 们 已 知 世 界 中 一 切 现代 国家 的 政治 计划 、 
《大 不 列 颠 百科 全 书 》( 第 三 版 ，1979) 中 定义 统计 学 为 : 
近代 导入 的 一 个 词 ,用 于 表示 任何 王朝 、 国 家 和 教区 的 总 括 或 概貌 . 
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同一 时 期 , 作为 统计 学 一 词 的 替换 ,也 使 用 了 叶 事 党 (publicistics) 一 疗 , 但 它 很 快 
就 被 淘汰 了 . IMMANE 1826 年 所 兰 的 《统计 学 与 政治 学 》 
一 书 中 ,把 统计 学 扩大 到 
给 定 一 个 国家 以 及 与 在 这 个 国家 生存 的 条 件 和 发 展 有 关 的 最 完全 最 
有 根据 的 知识 . 


在 英国 , 1791~ 1799 FH, HSCS. Sinclair) BE fe fth MRA — 48 38 1 1009 
中 使 用 了 统计 (staristics) 一 词 .这 套 104 T- RUE" XT RR CE ROSE T IE WES 
察 居民 所 享受 的 福利 程度 ,制定 将 来 的 改善 政策 而 对 本 州 的 调查 ”. 据说 当时 的 英 
国 读 者 对 辛 克 茉 一 十 使 用 德 证 的 “统计 学 (statistics) ”和 ”统计 的 (statistical) "而 不 
使 用 英语 中 类 似 的 词语 感到 吃惊 ， 

因此 18 世纪 中 那些 搞 收 治 权 术 的 人 认为 统计 学 是 作为 国家 权 木 的 -- 种 科学 ， 
其 作用 就 是 成 为 政府 的 耳 日 . 

然而 , 原始 数据 通常 是 含有 杂质 并 让 人 感到 混淆 的 . 要 使 其 具有 易 仅 的 解释 
并 能 用 于 各 种 收治 决策 , 就 必须 对 原始 数据 进行 适当 的 旋 纳 整理 .最 先进 行 这 种 
尝试 的 是 富有 的 伦敦 商人 格 竺 特 (J，Graunt，1620 一 1674) .他 详细 分 析 了 大 量 的 
死亡 人 数 友 ( 载 有 死亡 诛 央 的 数据 表 ),“ 删 招 死 广 表 中 极 模 糊 的 部 分 从 市 简化 为 清 
MAR, 并 白 然 地 将 所 观察 的 结果 归纳 简 缩 为 没有 任何 元 长 推理 的 扼要 的 儿 段 义 
E." MAA SASSO SRAM, 以 及 伦敦 市 区 与 郊区 人 口 
的 增长 率 等 有 用 的 结果 .他 由 此 而 做 出 的 牛 命 去 被 认为 是 现代 人 口 统计 学 的 基础 ， 
此 ,格兰特 站 最 早 用 实例 展示 如 何 利用 统计 学 来 描述 问题 的 现状 并 指导 事物 未 
来 发 展 方向 的 人 . 

然后 ,就 是 比利时 数学 家 凯特 勒 (A. Quetet,1796 一 1874) 把 统计 学 应 用 于 人 
类 事务 .凯特 勒 深 受 拉 普 拉 斯 的 影响 , 他 人 研究 概率 论 并 对 统计 学 和 把 统计 学 应 用 
于 人 类 事务 产生 了 兴趣 .他 收集 各 种 各 样 的 社会 数据 并 利用 他 称 为 是 “偶然 性 原 | 
的 法 则 " 正 态 法 则 米 措 绘 出 这 些 数据 的 频率 分 布 , 1844 E, 凯特 勒 利用 男子 身高 
分 布 的 正 态 性 法 则 找 出 了 法 国 躲避 征兵 的 人 的 身高 大 小 范围 , 使 那些 对 统计 抱 有 
怀疑 的 人 大 吃 一 惊 .凯特 勒 把 应 征 人 的 身高 的 分 布 与 一 般 男 子 的 身高 分 布 相 比 较 ， 
FA TARER ARREARS e, 找 出 了 2000 个 为 躲避 征兵 而 假 称 低 于 最 低 
身高 的 人 .希特勒 还 展示 了 如 何 从 研究 过 去 的 慨 向 来 预测 各 种 林 来 的 犯罪 行为 .为 
了 促进 对 统计 学 的 研究 .鼓励 把 统计 用 于 各 种 决策 行为 中 , 凯特 勒 曾 敦 促 拜 比 吉 
(C. Babbage, 1792 ~ 1871) 创立 伦 敦 统计 学 会 (1834) ,而 后 于 1851 年 ,凯特 勒 在 伦 
敦 水 晶 宫 主 持 了 太 型 研讨 会 , 讨论 关于 国际 问 合作 的 问题 .仅仅 3 年 后 , 就 在 布 鲁 
BRA CR “次 国际 统计 学 会 .作为 第 一 任 会 长 ,凯特 勒 强调 了 在 处 理 统计 数 
据 时 统一 方法 和 术语 的 必要 性 .凯特 勒 试图 把 统计 学 创建 成 改良 社会 的 一 种 工 其 . 
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经 济 学 和 人 口 统计 学 小 的 某 些 近代 概念 ,如 GNP( 国民 生产 总 值 ) .增长 率 RER 
和 人 [1 增长 率 等 等 , 均 基 凯特 勒 及 其 弟子 们 的 遗产 . 

自从 被 纳入 英国 科学 发 展 协会 一 员 以 来 , 统计 学 就 似乎 被 承认 为 是 一 门 科学 

了 .1834 第 创立 了 美国 虑 家 统计 学 会 .当时 ,认为 统计 学 是 
与 人 类 有 关 的 事实 ,可 以 由 数量 来 表示 ,并 且 经 过 天 量 的 累积 重复 可 

以 导出 一 般 规律 . 

19 世纪 上 半 叶 , 随 着 欧洲 社会 急 删 的 . 亡 业 化 ， 民众 的 关心 开始 集中 在 与 人 人 们 
社会 境况 有 关 的 问题 上 .这 期 间 , 特别 是 1830— 1850 年 间 ， 一 些 国家 创立 了 统计 
学 会 . 而且 “为 了 说 明 -个 社会 的 状况 与 繁荣 富裕 程度 ,以 收集 数据 并 焰 理 发 表 
为 "1 的, 很 多 国家 还 设置 了 统计 办 公 室 ,( 法 因 上 1800 年 创设 了 世界 上 第 一 个 中 
央 统 计 局 . ) 在 这 样 的 背景 下 ， 上 日 然 需 鉴 调查 每 个 国家 相对 于 其 他 国家 来 说 是 如 
何 发 展 的 , 从 而 技 出 其 发 展 增长 因素 . 为 了 进行 这 样 有 用 的 分 析 研 究 , 有 必要 在 
可 比较 的 基础 上 收集 各 国 的 数据 . 为 了 统 数据 收集 的 概念 .定义 以 及 使 用 … 致 的 
方法 ,以 使 "下 迅速 有 效 地 收集 和 比较 数据 ,提高 本 来 所 观测 数据 的 价值 ”经 过 努 
力 达 成 了 定期 召 冉 国际 会 议 的 协议 .第 一 次 国际 会 议 是 1853 年 在 布鲁塞尔 举行 
的 , 有 26 个 国家 的 153 名 代表 出席 .一 系 州 机 关 的 会 议 也 相继 甘 坟 ,这 些 会 议 均 
强调 了 在 不 同 的 政府 种 国 家 之 间 , 有 必要 “为 了 虑 同 的 日 的 , 在 同 -精神 下 ,由 统 
一 的 方法 进行 相同 的 调 贷 ”, 并 达成 一 至 协 议 ， 

显而易见 的 是 ,如 果 赤 使 统计 学 有 用 开发 展 成 为 -种 研究 工具 , 国际 问 的 合 
作 是 必需 的 ,为 了 交流 经 验 和 制定 共 癌 标准 ,1853 ~ 1876 年 间 锯 洲 各 国 主持 召开 
了 多 次 ( 约 如 次) 国际 统计 学 会 议 .人 们 认为 这 些 会 议 非常 有 用 ,为 了 推进 这 些 会 
议 的 结果 并 制定 今后 会 议 的 计划 , 1885 年 在 伦敦 统计 学 会 成 立 50 周年 的 纪念 会 
上 提出 了 设立 国际 统计 学 会 的 建议 .经 过 多 次 讨论 达成 了 设立 一 个 永久 性 的 国际 
组 织 一 一 国际 统计 学 会 的 决议 . 就 这 样 ，1885 4 6 H 24 日 ,国际 统计 学 会 
(International Statistical Institute, 简称 ISD 诞 生 了 .学 会 的 规章 和 条 例 决 定 包 括 
每 两 年 召开 一 次 大 会 ,会 员 资 格 种 类 ,杂志 的 出 版 等 等 .其 中 重点 强调 了 要 达成 “ 统 
一 编辑 和 制定 统计 表 的 方法 ,此 吸引 各 国政 府 在 解决 各 种 问题 时 注意 使 用 统计 
3E".1913 E, 学 会 在 荷兰 的 海 分 建立 了 永久 办 公 宝 ,负责 处 理学 会 的 出 版 事务 ， 

ISI 在 过 去 一 百年 来 相当 可 观 地 扩大 了 它 的 活动 .在 IS1 管 理 之 下 形成 了 数理 
统计 .概率 论 .统计 计算 ,抽样 调查 ,行政 统计 和 统计 教育 各 个 分 会 . 
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2.2. AE TERT BAL 


我 在 前 而 已 提 到 统计 学 词根 的 意义 是 指 对 数据 的 收集 和 整理 ,并 使 其 用 于 公 
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19 世纪 期 间 ， 作 为 解释 数据 或 郑 从 数据 中 提取 信息 来 作出 决策 的 -- 种 方法 ， 
RHFET TREL 基于 当前 的 趋势 , 我 们 如 何 对 一 个 人 口 总 体 的 社 
会 一 一 经 济 发 展 特征 进行 预测 ? 政府 采用 其 种 法 规 的 影响 如 何 ? 如 何 做 出 收治 决 
策 米 增加 社会 福利 ? 为 了 对 付 农作物 的 鞭 收 . 弦 亡 以 及 天 灾难 事件 ,我 们 能 制定 出 
相应 的 保险 系统 吗 ? 

还 有 另外 一 此 问题 等 待 满意 的 答案 :明天 会 下 雨 皮 ? 日 前 的 暖流 会 持续 多 长 
时 间 ? 在 更 科学 化 的 水 平 下 所 观察 得 到 的 数据 ,能 证 明 … 给 定 的 定理 吗 ? 从 个 人 
的 角度 可 以 有 这 样 -类 问题 ;在 我 选择 的 事业 中 ,什么 是 我 的 预期 目标 ? 我 如 何 利 
用 自己 的 资本 进行 投资 来 获取 最 大 收益 ? 

槛 回答 这 些 问 题 的 证 要 障碍 是 不 确定 性 一 一 责 乏 原因 与 结果 之 间 的 -- 对 应 
关系 .基于 不 确定 性 ， 人们 如 何 行 动 呢 ? 这 是 个 长 时 间 困 扰 人 类 的 问题 , 直到 20 
址 纪 初 ， 我 们 才学 会 了 驾驭 不 确定 性 ,发展 了 能 做 出 明智 决策 的 科学 -为 什么 面 
对 生活 中 每 时 每 刻 -- 直 困 绕 我 们 的 这 些 问题 ,人 类 花 了 这 人 么 长 的 时 间 才 找 到 答案 
呢 ? 为 了 问答 这 个 问题 , 让 我 们 来 考察 -… 下 通常 我 们 用 于 解决 问题 和 建立 新 知识 
HEARREN, 以 及 在 过 去 25 个 世纪 中 人 类 思想 所 产生 的 变化 . 


2.2.1 SRSA 























I. 演绎 法 (推断 法 ) 

演绎 推理 最 早 是 两 千 多 年 以 前 由 占 希 腊 的 哲学 家 们 提出 来 的 ,后 经 几 个 世纪 
的 数学 家 们 的 丰 究 加 以 完善 . 首先 我 们 给 定 几 个 前 提 或 公理 , 例如 Al , As ,…, 其 
中 每 一 个 自身 被 三 认为 真实 ,我 们 可 以 选择 这 些 公 坚 的 任意 集合 , 如 A, A 来 证 
明 一 个 命题 P P, 的 真实 性 惟一 地 依赖 于 公理 A, 和 A, 的 真实 性 ;事实 上 P 的 真 
实 性 与 其 他 未 被 明确 用 于 推断 的 公理 中 无 关 的 ,类 似 地 ,可 用 A, As ,As 导出 命题 
P 等 等 . 

在 演绎 推理 下 没有 产生 超过 前 提 的 新 知识 , 因为 所 有 推出 的 命题 是 纺 含 在 公 
理 之 中 的 .人 们 设 有 要 求 公理 或 导出 的 命题 与 现实 有 任何 关系 ,就 如 下 面 引言 中 所 
刻画 的 : 

数学 是 我 们 并 不 知晓 我 们 谈论 的 对 象 ,也 不 关心 所 言及 内 容 真 假 的 
一 门 科学 . 








罗素 (B. Russell} 
数学 家 可 以 相 比 于 一 位 服装 设计 师 , 因 为 服装 设计 师 完全 不 注意 他 
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所 设计 服装 所 适合 的 对 象 ， 

HFT. Danwig) 
值得 注意 的 是 , 怀 管 数学 被 认为 是 "最 高 真理 ” ,但 是 作为 数学 基础 的 演绎 逻辑 并 
不 是 没有 逻辑 缺陷 的 . 正如 前 面 所 提 到 的 ,演绎 逻辑 中 容许 利用 公理 集合 中 任意 子 
集合 上 证明 -个 命题 ,这 个 命题 与 其 他 没有 用 到 的 公理 是 励 关 的 ， 

此 时 , 产 牛 了 如 下 问题 : 公 蛙 系 中 任 一 了 集合 ,如 Ai ,As 产生 PP 为 是 之 命题 ， 
而 另 一 集合 As ,As ,Au 产生 一 个 了 之 否 命题 , 这 样 会 导致 -个 矛盾 蚂 ? 会 有 一 个 
三 角形 三 个 内 第 和 在 公设 ALAS 下 为 180°, 而 在 公设 As ,As ,As 下 又 代表 不 同 的 
数字 的 事 发 生 吗 ? 在 试 区 利用 数学 公理 证 明 不 会 产 牛 这 种 矛盾 的 过 程 中 , 我 们 得 
到 儿 个 令 人 惊奇 的 结 洒 , 善 名 数理 逻辑 学 家 肯 德 尔 在 这 方面 进行 了 岗 致 的 研究 论 
WE, 他 巧妙 地 证 明了 : 基于 所 给 定 公理 系统 的 推理 ,人 们 不 能 证 明 由 该 公理 系统 
不 可 能 导致 矛盾 的 结果 . 





演绎 推理 
公 E Ar Az Ay Ag o {前提 假 没 } 
Ip ERA UE (证 明 ) 
命 题 (导出 的 结果 ) 
P P. 


了 Pi Poet Af TE BUR? 


同时 也 证 实 了 这 样 一 个 推断 , BUR TS AR Bs EVA TREINTA RUE P 
及 其 否定 命题 , 邦 么 这 个 公理 系 就 能 使 我 们 导出 任何 我 们 想 要 得 到 的 凶 盾 .这 时 
让 我 们 来 看 一 下 1958 年 出 版 的 《百年 回 天 ?第 11 卷 中 ,著名 英国 统计 学 家 费 歌 关 
于 "概率 的 性 质 "演讲 中 提 到 的 - - 段 趣闻 , 英国 善 名 数学 家 哈代 (G. H. Hardy) A 
在 剑桥 大 学 二 一 学 院 的 晚餐 会 上 谈 到 了 二 甸 提 到 的 这 样 一 个 值得 省 意 的 事实 .于 
是 坐 在 哈代 对 面 的 一 个 学 者 接 过 他 的 话题 问 道 : 
学 者 : 哈代 ,如 果 我 说 2+2=5, 你 能 证 明 所 给 出 的 任意 命题 吗 ? 
哈代 : 是 的 ， 我 想 可 以 . 
学 者 : BARE JOE E (McTaggart HAF BSH, 
哈代 : 如 果 262-5, WS=4, MAMA 3, 即 2=1 .麦克 塔 格 塔 和 
罗马 主教 是 两 个 人 , CAA FT 1, 因此, RABBBHAI DEK, 
数学 是 在 严格 规则 下 的 一 种 游戏 , 淮 会 知道 是 否 亦 某 -… 天 会 发 现 “系列 的 不 协调 
LH 
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ll. 归纳 法 


归纳 推理 则 是 另外 -~ 种 情况 .这 里 我 们 所 面 对 的 问题 止 好 与 上 述 问 题 相 反 ， 
即 依 给 定 的 某 些 结果 来 决定 前 提 . 现实 世界 里 ,要 基于 不 完全 或 劣质 的 信息 做 出 决 
断 , 只 有 通过 归纳 推理 . 下 面 给 出 几 个 必须 要 采用 归纳 法 的 例子 . 

特殊 环境 中 需 归 基于 不 确定 信息 做 出 决策 : 

* 菜 案件 的 被 告 人 人 确实 犯 有 杀人 罪 吗 ? 

* 某 个 母亲 声称 这 个 男子 是 她 孩子 的 生父 属实 吗 ? 





预测 

* 从 星期 一 到 星期 二 斯 泰 特 科 利 奇 (Stare Collcgc) 一 直 在 下 两 ,周末 会 继续 
下 雨 吗 ? 

* 明日 的 道琼斯 指数 会 下 降 多 少 ? 

* 明年 汽车 市 场 的 需求 有 多 大 ? 


假设 检验 
* 治疗 头痛 时 , Fi Tylenol) Et LEW R (Bufferin) i #738005 7 
WARE Jp Ss RA RAR? 














VA E. ARSE BUS AE I PS TE T GE TER. E PE UE EH — SH EDE RIJE EL 

USUAL BO, EAA ERES TEUER IS REA P TARAR, 也 就 

是 说 , 结果 和 假设 之 间 的 关系 不 是 … 对 一 的 . 所 谓 归纳 推理 , 就 是 由 观测 的 数据 

去 匹配 一 个 假设 , 从 而 由 特殊 推 向 一 般 的 逻辑 推 埋 过 程 . 让 此 面 产 生 新 的 知识 ,但 

是 由 于 在 数据 和 假设 之 间 缺 乏 一 对 一 的 对 应 关系 ,这 是 一 种 带 有 不 确定 性 的 知 

识 .与 给 定 公理 下 的 演绎 推理 不 同 , 归纳 推理 由 给 出 的 数据 所 作 的 判断 是 缺乏 精 
观察 得 到 的 数据 ”归纳 推理 过 程 ”可 能 的 假设 
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人 确 性 的 .这 种 精确 性 的 缺乏 有 碍 于 对 归纳 推理 的 系统 化 . 按 人 们 习惯 的 推演 逻辑 ， 
如 果 发 展 的 种 理论 或 导 人 的 推 埋 规 则 不 能 保障 给 出 准确 的 结果 ,它们 似乎 就 不 
被 人 们 所 接受 .所 以 , 归纳 推理 更 多 好 被 看 作为 一 种 技巧 , 其 运用 成 功 的 程度 依 
RAPP AMR BE ,经验 各 直觉. 

Hy 为 所 做 选择 . 在 于 图 ,人 们 吕 提 出 如 下 问题 : 

* 基于 所 给 定 的 信息 数据 ， 能 制定 出 选择 一 个 或 儿 个 假设 的 法 则 吗 ? 

* 什么 是 由 某 种 指定 的 法 则 米 选 择 特定 假设 Hp 过 程 中 的 不 确定 忻 ? 





ll. 风险 管理 的 逻辑 方程 


-可 到 20 导 纪 初 ， 直 打开 处 理 上 述 问题 的 突破 呆 . 人 们 认识 到 ,尽管 由 特殊 
到 - - 般 化 的 规律 所 建立 起 来 的 知识 是 不 确定 的 ，-- 旦 能 度量 所 含 的 不 确定 性 , DI 
获得 的 知识 尽管 种 类 个 癌 但 是 是 懈 定 的 .这 种 新 的 结构 为 如 下 的 逻辑 方程 : 

[未 确定 的 知 调 s [所 含 不 确定 性 量度 的 知识 | = | 可 用 的 知 训 
这 不 是 暂 学 , 这 是 -种 新 的 思维 方法 .由 这 个 基本 方 称 可 以 导出 风险 管理 的 一 个 
有 北方 法 .而 日 把 人 类 从 神 论 和 算命 先后 中 解放 了 出 来 . 它 把 未来 暂 于 现时 可 做 出 
Bit re A M AL Mic A on : 











= 


* 刘 果 我 们 不 得 不 在 不 确定 性 的 前 提 下 做 出 抉择 , 则 错误 是 不 可 避免 的 . 
x 如 果 鲁 误 赴 不 可 避免 的 , 则 在 一 定 的 规律 下 做 出 据 样 (形成 新 的 具有 不 确 
定性 的 知识 ) 时 ,最 好 我 们 能 知道 犯错 误 的 频率 (对 不 确定 性 量度 的 知 
识 ). 
* 这 样 的 知识 能 够 用 于 找 六 制定 决策 的 某 种 规律， 从 而 使 我 们 减少 让 日 性 ， 
使 做 出 错误 决策 的 频率 最 小 , 或 者 使 由 错误 决策 产生 的 损失 最 小 . 
这 样 由 最 优 化 决策 米 钼 理 的 问题 能 够 用 演绎 推理 米 解决 .所 以 ,站 纳 推断 可 以 旭 归 
REB ER TERT. 
iSt RATA UTR AUR I Jn BETRA, RAMIER OH FR 
JNA ROGA, 如 : MI TUERI. 明日 无 南 . wR, 这 种 预报 错误 很 多 . 如 今 , 预 
BIERS: 明 口 有 十 的 可 能 忻 为 0%, 看 起 来 似乎 是 -种 不 明确 的 说 法 ,这 
个 30% 的 数字 是 如 何 得 来 的 .我 的 一 个 数学 家 朋友 告诉 我 说 , 电视 台 有 10 个 气象 
TR, WHEA AOS, 如 果 其 中 有 3 个 回答 有 十 ,那么 电视 台 则 
报道 明 H 有 十 的 可 能 性 为 30% , 
当然 ,这 里 不 是 指 如 何 每 到 30% 这 个 数字 , 它 具 有 更 深 的 含意 . 它 表 示 存 过 
太 某 -大 所 观察 人 旬 的 如 癌 今 日 大 气 层 的 状态 时 ,次 口 有 十 的 概率 ,这 是 基于 大 景 
观察 数据 所 得 刘 的 复杂 的 计算 结果 ， 才 玉 了 明日 有 雨 的 不 确定 性 的 量度 .在 这 种 
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意义 卜 , 关于 明 下 大 气 有 南 可 能 性 的 预报 天 式 儿 乎 和 数学 定理 一 样 准 确 ， 通报 了 
一 个 人 在 计划 次 日 行动 时 所 需 的 - - 切 必 要 信息 .各 人 可 以 根据 各 人 的 需要 ， 以 不 
同 的 方式 来 利用 这 个 信息 . 而 像 明 H 有 雨 这样 REE A A a E PEE RE R ERR 
断 问 龙 堂 无 实用 价值 的 ,在 某 种 意义 下 二 不 合 还 辑 的 . 

R21 RA MR OREHE) 





数据 可 能 性 概率 
今日 大 气 层 的 明 口 有 南 30% 
条 什 明日 无 南 70% 





演绎 法 与 归纳 法 之 问 有 AR. WERDE, Ox CETT A 
许 选择 儿 个 前 提 ; 纪 纳 推断 中 , 不 同 的 数据 信息 组 合 可 以 导致 不 同 的 .有 叶 基 至 
是 相互 闻 后 的 结论 .内 此 必须 使 用 全 部 数据 信息 . 必 此 的 情况 下 ,数据 的 编辑 或 剔 
除 必 须 是 由 推断 过 程 本 身 决定 , 而 不 是 按 数据 分 析 者 本 人 的 意识 来 选 择 . 

利 几 统 计 学 我 们 能 够 江 明 任何 侍 物 的 这 种 说 法 ,是 指 我 们 从 可 以 得 凶 的 数据 
信息 中 总 能 选择 到 能 汪 实 任何 预想 的 有 上 岂 的 部 分 .这 是 政治 家 ,有 时 科学 家 也 这 样 
来 儿 售 他 们 疯 点 的 “种 手段 ,商人 也 如 此 操作 来 出 售 他 们 的 产品 . 

SSA HEMT | EA 点 值得 注意 . 在 推断 过 冬 中 ， ERRER ERE A EAT 
已 知 的 信息 而 没有 加 入 任何 未 经 证 明 的 假设 或 让 对 旭 的 观点 . 让 我 们 来 看 看 其 个 
上 上 子 相信 上 上 宫 只 雇用 女仆 的 是 舱 甩 南 : 

突 天 王子 在 其 领地 内 巡游 在 喝彩 的 人 群 中 ,他 发 现 一 个 长 相 酷 似 

自己 的 男子 .王子 把 这 个 男子 召 到 面前 问 拓 “你 村 亲 在 我 王宫 里 干 过 活 

Us" "GO "那个 男子 回答 ,“ 但 是 我 父亲 曾 在 王宫 里 千 过 活 .” 






N. 诱导 法 


时 ,新 的 理论 的 产 乍 完全 不 基于 任何 数据 信息 ,而 是 任 直 觉 或 瞬间 的 想 
像 ,这 种 方法 在 逻辑 术语 中 被 称 为 “诱导 法 ”. 其 后 人 们 再 进行 一 系列 实验 米 验证 这 
些 理 沦 . 这 一 类 的 黄 有 名 例子 可 以 举 出 DNA 的 双重 螺旋 性 .作对 性 理论 GH a 
BEES. 
归纳 法 利诱 导 法 之 间 的 区 别 很 微妙 . 归纳 法 中 我 们 由 实验 数据 信息 和 对 它们 
的 分 析 引 导 得 到 一 个 结 沦 .但 是 新 知识 产生 的 最 根本 的 一 步 ， 不同 程 度 .依赖 于 
-个 人 已 有 的 经 验 和 瞬间 的 想像 .在 这 种 意义 上 ,导致 人 们 相信 所 有 的 归纳 方法 
就 是 诱导 法 . 
首 结 起 来 ,知识 的 发 展 依赖 于 以 下 三 个 逻辑 过 程 : 
Vig: 基 才 观 察 到 的 数据 信息 产生 新 知识 . 
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BS: 由 直观 而 不 是 数据 信息 产 牛 新 知识 ， 
演 绎 : 证 时 所 提出 的 理论 . 


2.2.2 ”如何 度 量化 不 确定 性 


由 归纳 推断 导出 结论 的 主要 概念 是 不 确定 性 的 度 星 化 ,就 像 瑚 2. 1 中 提 到 的 
大 气 预 报 一 样 .明日 有 耳 的 祁 率 为 30% 是 基于 以 前 的 观察 值得 到 的 .但 是 由 于 没 
有 固定 的 方法 ,因而 对 不 确定 性 的 量化 问题 - 吉 存 有 有 竺 议 .甚至 还 建立 了 各 种 统 
计 研 究 所 来 化 力 于 研究 度量 不 确定 性 的 不 同方 法 . 

最 初 尝试 量化 不 确定 性 的 是 贝 叶 斯 (T，Bayes, 7 ~1761), 据说 他 死 十 59 岁 
(出 年 只 期 不 明 ) . 贝 叶 斯 在 -组 可 能 的 假设 下 介绍 了 先 验 分 布 的 概念 ， 即 在 数据 
信息 被 观察 到 之 前 , 提出 对 不 同 的 假设 的 信赖 程度 大 小 .假设 4 的 可 信 度 表 为 
p( 凡 ) 并 晶 是 给 定 的 .同时 如 果 在 给 定 假设 hh 下 数据 4 的 概率 分 布 已 知 为 p(a 1h)， 
就 可 以 使 我 们 得 到 观测 数据 信息 的 边缘 概率 分 布 p Ca 于 是 现在 我 们 能 计算 在 
给 出 数据 信息 d 时 , 假设 4 的 条 件 概率 分 布 ,这 被 称 之 为 贝 叶 斯 定理 , 表 为 如 下 


BR: 




















_ pOOpCIÍh) 
plhidy = b 


这 即 为 后 验 分 布 ,或 是 在 已 知 疯 测 结果 的 条 件 下 关于 所 选 假设 的 不 确定 性 的 分 
布 ,因而 ,由 所 选 假设 的 先 验 知识 和 观测 所 得 的 结果 , 我 们 已 经 获得 了 关于 这 个 可 

由 时 斯 定理 是 归纳 推理 中 和 用 概 座 论 为 工具 的 有 独创 性 的 尝试. 然而 一 些 统 
计 学 者 对 引用 先 验 分 布 p(A) 来 解决 问题 的 方法 感到 基 种 程度 的 不 安 , 除非 先 验 
分 布 的 选择 是 按 客观 售 出 的 ,例如 , 是 基于 过 去 观察 的 事实 结果 而 不 是 由 人 的 主 
观 或 为 方便 后 验 分 布 的 数学 计算 来 若 出 的 .实际 上 , 不 利用 先 验 分 布 而 发 展 推断 理 
论 是 近代 统计 学 创始 者 们 的 努力 ,如 : ERREK. Pearson, 1857 4£ 3 H 27 H~ 
1936 年 4 月 27 日 ), VHRKCR.. A. Fisher, 1890 4E 2 J3 17 H —1962 ^E 7 H 297), 内 
42(J. Neyman,1894 ££ 4 H 16 H —1981 4E 8 H 5 H), BY: HEZKXE(E. S. Pearson, 
1895 448 H 11 A —1980 4 6 H 12 日 ) 和 沃 尔 德 (1902 年 10 月 31 月 一 1950 年 12 
月 13 哩 ) 等 大 都 做 了 这 方面 的 尝试. 他 们 的 方法 并 不 是 没有 逻辑 困难 的 .然而 缺乏 
- “个 完整 的 逻辑 方法 论 , 并 不 阻 但 把 统计 学 用 于 日 常 的 决策 或 是 用 于 解释 自然 界 
药 神 秘 . 这 种 情形 类 似 于 颖 学 中 我 们 已 有 的 经 验 ,在 治疗 疾病 考虑 某 种 有 效 药品 
Tj, 即便 它 的 治疗 效果 不 是 很 理想 或 带 有 一 定 的 剧 作 用 , 甚至 于 在 一 些 相 当 罕 见 
的 病例 中 , 这 种 药 的 有 效 性 还 没有 完全 在 临床 中 被 验证 的 情况 下 , 你 仍 不 会 狂 瑰 
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证 患者 使 用 这 种 药 . 当然 必须 继续 人 研究 新 结 .20 fif LEE, AOR MISS RTT, f 
设 检验 和 决策 而 发 展 起 来 的 统计 学 的 方法 论 , 像 决 吕 的 洪水 一 样 冲 开 了 统计 学 应 
用 于 人 类 活动 各 个 领域 的 大 门 , 读 找 新 的 工兵 来 处 理 不 确定 性 的 需 鉴 也 急速 增长 ， 
统计 学 的 普遍 存在 以 及 在 开拓 新 知识 领域 方面 的 应 用 已 远近 超过 了 20 性 纪 内 的 
任何 技术 或 科学 发 明 . 

随 着 不 确定 性 的 虚 量 化 ,我 们 能 够 提出 新 的 问题 并 苹 能 给 出 适用 于 山 实 需 蜂 
的 解答 ,这 些 问题 通常 是 不 能 由 夫 于 “是 "或 “不 是 "的 传统 或 亚 里 土 多 德 之 逻辑 来 
回答 .出 控制 或 碱 少 不 确 定性 , 或 者 哆 稠 归 的 是 去 考虑 不 确定 性 ,使 我 们 能 够 在 
最 优化 方式 下 管理 个 人 或 社会 的 活动 . 300 BU, 法 国 数学 家 笛 卡 儿 (1596 ~ 
1650) 有 dA di: 


当 我 们 不 具备 决定 什么 是 真理 的 力量 时 , 我们 应 遵从 什么 是 最 可 能 
的 ,这 是 千 真 万 确 的 真理 . 


此 , 从 数据 中 获取 信息 并 做 出 推断 的 新 学 科 产 生 了 ,而 号 统 计 学 这 个 不 语 的 范 
国 也 从 数据 自身 扩展 到 解释 数据 的 意义 上 了 . 

总 结 让 来 ,偶然 性 不 再 足 -: 件 值得 担心 的 事情 或 者 是 -种 无 知 的 表现 . 相反， 
它 是 表达 我 们 拥有 知识 的 最 其 雍 辑 性 的 方法 .我 们 能 够 接受 不 确定 性 ， 承认 它 的 
存在 , HARRAREN, 问 时 话 明 ,尽管 面 对 不 确定 性 ,知识 的 发 展 和 适用 行动 
HARETAN STD. Cows) REM N: 














ATR A LL ATIA RHR ERR L ER KER DB REL XE 
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AAR FERRY AMEE — EN, 但 是 解决 的 办 法 是 找到 偶然 性 的 规律 ,我 们 决 
定 旨 考察 的 对 象 , 给 出 其 发 生 的 概率 作为 这 些 对 每 所 具有 的 不 确定 性 的 量度 .在 
已 知 各 种 事件 发 生 的 结果 各 发 牛 的 慨 率 的 情况 下， 不 确定 性 下 的 决策 可 以 化 归 为 
演绎 逻辑 的 问题 . 处 理 得 然 性 已 不 再 成 为 无 所 适 从 的 事情 了 ， 





2.3 统计 学 的 未 来 


统计 学 与 其 说 是 收集 整理 数据 引出 答案 的 一 组 规则 ,不 如 说 是 一 种 
那么 今天 所 研究 的 而 和 且 应 用 上 实际 的 统计 学 , 是 … 门 科学 ,还 是 一 种 工艺 或 
是 一 门 艺术 呢 ? 也 许 统计 学 是 ; 的 一 个 组 合 . 
称 统计 学 为 - TEPA, 是 指 它 与 那些 由 某 些 基本 原理 引导 出 的 其 有 广泛 应 用 
意义 的 科学 技术 一 样 ,. 这 些 技术 不 能 出 村 周 定 的 模式 ,使 用 者 在 给 出 的 情况 下 必 
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须 松 据 所 掌握 的 专门 知识 选择 适用 的 技术 , 而 县 如果 需 要 ,还 要 进行 必要 的 修正 ， 
统计 学 在 建立 软 科 学 的 经 验 规律 中 起 着 重要 作用 .更 何况 , 作为 量化 和 表 现 不 确 
定性 的 方法 的 统计 学 一 一 其 基础 和 很 多 哲学 观点 有 关 , 能 够 对 任 - 主题 进行 独立 
的 讨论 .因此 , 广义 之 下 , 统计 学 是 一 门 分 离 的 学问 , 可 以 说 是 关于 一 切 学 问 的 学 
In]. 
统计 学 是 -- 种 工 点 ,如 同 工 炎 生 产 过 程 中 的 质量 控制 程序 - 样 ,统计 学 的 方法 
论 就 是 在 为 了 保证 产品 达 公 所 希望 的 质量 和 保持 其 稳定 性 的 管理 系统 中 建立 起 来 
的 .统计 方法 也 能 够 用 于 控制 减少 和 考察 不 确定 性 ， 从 而 极 大 地 发 挥 个 人 和 社会 
的 工作 效率 . 
统计 学 也 是 一 门 艺 术 .这 是 因为 依赖 二 归纳 推理 的 统计 学 的 方法 论 不 是 完全 
能 编 成 条 例 或 是 没有 争议 的 ,不 同 的 统计 学 者 对 同一 组 数据 的 分 析 处 理 可 能 得 到 
不 同 的 结论 . 比 起 由 统计 学 工具 所 获得 的 信息 来 说 , 通常 实际 给 出 的 数据 所 含 的 
信息 量 要 多 得 多 ,就 像 一 本 印度 小 说 《红色 城堡 }(The Red Fort) 8 5 86588 2.14 8 
中 所 说 的 -- 样 , 使 用 数字 来 讲 故 种 依 粮 于 统计 学 家 的 技巧 和 他 们 的 经 验 .在 这 个 
意义 下 ,统计 学 也是 一 门 艺术 . 
统计 学 的 本来 会 如 何 呢 ? 今 人 , 统计 学 已 发 展 成 为 一 门 媒介 科学 . 它 研究 的 
对 象 是 其 他 科学 的 逻辑 和 方法 论 一 一 做 出 决策 的 还 辑 和 试验 这 些 决策 的 逻辑 , 统 
计 学 的 未 来 依赖 了 向 其 他 学 习 针 咸 内 的 研究 首 正 确 传授 统计 学 的 观点 ; 依赖 于 如 
何 能 够 在 其 他 知识 领域 内 将 其 主要 门 题 模式 化 . 
逻辑 推理 方面 ,利用 专家 的 让 明 , 再 如 上 数据 提供 的 信息 ,有 希望 在 评价 不 确 
性 上 折 宽 统计 学 方法 . 
我 已 经 提 反 统计 学 是 科学 ,十 三 艺 ,也 是 一 门 艺术 一 一 作为 处 理 不 确定 性 和 做 
出 最 佳 决策 行动 的 新 近 发 现 的 逻辑 一 一 我 这 里 必须 指出 的 是 将 来 发 展 过 程 中 有 可 
能 遇 现 的 危险 ,如 前 而 所 提 到 的 , 统计 巴 测 会 出 现 失误 , 代 比 起 心灵 预感 或 迷信 来 
说 ,显然 统计 瑞 测 更 值得 信 种. 如 果 你 做 的 预测 错 了 ,你 的 顾客 可 以 控告 你 吗 ? 最 
SALA SREY Er el PLLA 1986 565 月 24 HEH BS" Vo IER HR" CR 
的 ,文章 题 目 为 "气象 顶 报 员 的 呼吸 变 轻松 了 ”， 
一 个 联邦 的 上 诉 法 话机 教 地 订正 了 一 个 有 关 天 气 预 报 常 涉 政 府 责任 
的 严重 错误 . 
去 年 8 月 ,美国 一 地 方法 庭 裁定 应 付 给 由 于 遭受 风 肾 袭击 而 趴 身 的 
ZNSE A RB 125 万 美元 的 赔偿 费 ， 因 为 这 场 风 暴 没 有 被 预报 .法官 
教 定 致 府 对 这 次 事故 负 有 责任 ,因为 政府 没有 及 时 小 理 设 在 一 个 浮标 上 
的 风 可 器 一 一 其 作用 是 帮助 预报 麻 省 东部 鳞 鱼 乾 的 天 气 闫 况 . 
这 个 裁决 前 些 天 被 上 诉 法 庭 驳 回 ， 理 由 是 天 气 预 报 是 政府 "可 自由 
处 理 的 工作 ”",“ 所 做 裁决 不 适用 于 这 种 场合 ". 
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上 诉 法 庭 指 出 :“ 天 气 预 报 经 常 出 错 . 如 果 仅仅 是 这 类 事件 中 一 小 部 
分 遭受 损失 的 当事人 成 功 地 找 出 一 个 专家 ,能 使 法官 信服 政府 应 该 做 得 
更 好 ” ,那么 政府 的 责任 将 是 “无 止境 和 无 法 承受 的 ” 
为 有 可 能 申诉 到 最 高 法 院 , 这 个 案件 的 处 理 还 没有 终结 .但 是 那些 二 实践 
者 不 精确 科学 的 官方 气象 预报 家 们 可 以 轻松 地 透 一 口气 了 . 

这 样 的 例子 是 不 多 见 的 , 伺 这 或 多 或 少 会 阻碍 统计 咨询 家 们 对 新 的 、 或 更 具 挑 
战 性 领域 的 冒险 探索 ， 并 多 多 少 少 会 制约 统计 学 的 发 展 . 

















第 3 章 数据 分 析 的 原理 和 策略 
一 一 数据 的 交叉 检验 


3.1 数据 分 析 的 发 展 历史 


数据 ! 数据 ! 他 急切 地 叫 着 ， 没 有 黏土 ,我 怎么 能 做 夸 . 
FI @ H3 4 (Conan Doyle) 

统计 分 析 的 形式 随时 代 的 排 移 而 变化 着 ,但 是 “从 数据 中 提取 一 切 信息 "或 者 
“归纳 和 揭示 "作为 统计 分 析 的 及 的 却 一 直 没 有 改变 . 统计 学 还 没有 成 熟 为 一 个 具 
有 完整 稳固 基础 的 知识 领域 .在 一 定时 期 内 某 些 统计 方法 被 普遍 应 用 , 但 是 随时 
间 的 推移 这 些 方法 义 会 被 更 时 尚 的 六 法 所 取代 . 尽管 有 很 多 争论 , 统计 方法 和 应 
用 领域 却 在 不 断 扩大 .具有 绘图 功能 的 计算 机 已 经 对 数据 分 析 产 生 了 巨大 的 影响 . 
让 我 们 来 对 数据 分 析 的 发 展 历史 作 一 概述 . 

通常 , 描述 统计 学 和 理论 统计 学 被 人 们 庆 为 下 统计 学 中 方法 不 同 的 蝴 个 领 
域 .前 者 的 莫 的 是 在 “统计 描述 "的 意义 下 综合 整理 给 定 的 数据 集 ,例如 对 位 置 离 
差 高 阶 捧 和 指数 的 浏 量 ,并 通过 失 些 图 形 ,如 直方 图 、 条 性 疼 , 箱 图 和 二 维 平面 
图 ,来 表现 数据 直观 醒 日 的 特征 .这 个 方法 并 不 涉及 观测 数据 的 随机 结构 (或 概率 
分 布 ). 因 此 , 计算 得 到 的 各 种 措 述 统计 芋 可 用 来 比较 不 同 的 数据 集合 . 某 于 数据 
集 的 特征 和 区 解答 的 问题 ,甚至 制定 了 一 些 规则 用 于 选择 一 些 可 替换 的 统计 量 ， 
如 用 于 描述 位 置 特征 的 半 多 值 .中 位 数 和 众 数 . 这 群 的 统计 分 析 被 称 为 描述 数据 分 
9r, 记 为 DDA(Descriptive Data Analysis). J} iij, 在 理论 统计 学 中 ,虽然 其 目 
的 也 是 综合 整理 数据 , 但 它 足 研究 概 举 分 布下 的 一 个 特定 分 支 (或 称 为 模型 ) .在 
这 种 情 彤 下 ,综合 整理 或 描述 统计 基 主 又 依赖 于 某 个 特定 的 随机 模型 . 这 些 统计 
基 的 分 布 被 用 来 确定 在 推断 其 些 未 知 参数 时 的 不 确定 性 的 范围 .于 旦 这 样 的 方法 
被 称 为 推断 数据 分 析 ， 沁 为 IDA( inferential Data Analysis). 

卡 * 皮 人 尔 和 硬是 第 -- 位 试图 沟通 DDA 与 1DA 的 统计 学 家 .他 利用 基于 和 矩 和 直方 
图 的 描述 分 析 所 得 到 的 结果 来 进行 有 关 分 布 族 的 推断 .为 此 日 的 , 卡 .皮尔 森 发 明 
了 第 一 个 也 许 也 可 以 说 足 最 重 归 的 一 个 检验 准则 一 一 上 方 统计 量 , 以 此 用 十 检验 
已 知 数据 是 否 来 自 某 一 特定 的 随机 模型 (概率 分 布 族 ) ,或 已 知 数据 是 否 与 某 -给 
定 的 假设 一 致 ,这 种 检验 准则 “项 未 了 做 出 决策 的 一 类 新 方法 ”. YE P PEE 
(Hacking，1984) 的 文献 中 , 卡 - 皮 尔 森 的 卡 方 检验 被 誉 为 是 自 1900 年 以 来 在 科学 
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学 家 费 区 也 曾 对 我 硼 示 了 对 卡 * 皮 尔 森 的 卡 方 统计 量 的 极 商 的 评价 . BBR RR 
创立 了 一 系列 可 通过 4 种 皇上 来 识别 的 概率 分 布 .通过 青 方 出 和 卡 方 检验 ， 卜 : 皮 
和 尔 森 完成 的 出 鱼 的 研究 『 作 之 一 是 发 现 了 厅 其 些 动物 中 锥 果 大 小 的 分 布 十 来 自 师 
个 正 态 分 布 的 汇合 分 布 (参见 卡 : 皮 尔 森 ,1914 一 1915). 
卡 方 检验 米 检举 一 个 复合 假设 , PUM BOR RE BS 
布 族 时 ， 需 要 发 展 参 数 估计 的 一 般 广 法 . 卡 ' 皮尔 森 提 出 了 中 年 来 估计 人 参数 的 方 
法 , 并 且 基 于 估计 量 拟 合 的 分 布 米 进 行 卡 方 检验 . 这 个 方法 共 后 由 费 葡 做 了 两 方 
血 的 完善 ,一 是 通过 巾 极 大 似 然 法 对 森 知 参数 的 估计 ,得 到 已 知 数据 的 较 好 的 拟 
合 ;其 次 在 估计 未 知 参 数 时 , 利用 月 由 度 的 枫 念 使 我 们 能 更 准确 使 用 上 方 检 验 . 

20 一 30 EAI), RRES -系列 异常 卡 富 的 统计 妃 想 .在 他 1922 全 的 一 
篇 通过 特定 的 随机 模型 来 分 析 数 据 的 英 基 性 的 论文 中 , PHONE T RES poen 
的 基础 . 费 软 发 展 了 大手 正念 假定 下 对 各 种 假 次 的 精确 的 小 样本 检验 ,提出 了 利用 
标准 检验 值 表 来 帮助 检验 ,通常 这 些 统 计 表 给 出 了 5% 和 和 1% 时 的 检验 临界 值 .这 
个 时 期 内 , 在 费 软 的 影响 下 ,非常 重视 显 昔 性 检验 . 当时 的 统计 学 家 ,如 哈 特 林 、 鲍 
斯 (RR.C. Bose) ,次 伊 (S. N，Roy) 和 威 尔 克 斯 (Wilks) 等 对 精确 抽样 理论 作出 了 很 
多 贡献 .尽管 费 软 在 他 1922 年 的 论文 中 提 到 由 卡 ' 皮尔 森 首 先 矢 虑 到 的 模 碟 的 设 
定 是 统计 学 研究 的 … 个 重要 方面 , 但 是 他 没有 对 这 个 问题 展开 进步 探讨 .或 许 
这 是 因为 费 软 的 观察 只 是 在 生物 学 研究 中 的 小 样本 范围 内 ， 内 而 在 对 模型 设 定 问 
题 的 探求 上 ,在 到 过 对 观测 数据 的 详细 描述 分 析 去 寻找 一 定 的 特征 , 或 是 经 验 地 
决定 合适 的 数据 安 换 去 拟 合 确 认 一 个 假设 的 随机 概率 模型 等 问题 上 , 费 葡 没有 更 
多 的 研究 | 度 . 在 决定 模型 的 设 定时 ,， 费 软 仅 依赖 于 他 自身 的 经 验 以 及 如 何 确定 
数据 时 的 外 部 信息 .| 参见 费 网 1934 年 的 -篇 经 典 论文 .这 篇 论文 论述 数据 收集 确 
认 的 方法 对 频率 估计 的 影响 , ] 在 这 个 由 费 软 的 成 果 激 励 统计 学 发 展 的 时 代 , 很 
多 其 他 统计 学 家 努力 去 探索 被 称 为 是 步 参 数 统计 检验 的 准则 ,这 些 检验 的 分 布 足 
与 数据 所 假定 的 随机 概率 模型 无 关 的 (皮特 晶 (Pitman)，1937)， 并 从 数据 所 设 分 
布 的 正 态 性 的 偏离 出 发 , 调查 研究 费 软 所 提出 的 检验 准则 的 稳健 性 . 

20 世纪 20 一 30 年 代 , 由 费 歌 所 开创 的 通过 实验 设计 来 收集 数据 的 方法 也 有 
了 系统 的 发 展 , 这 一 系统 发 展 使 人 们 能够 通过 方差 分 析 这 样 特定 的 方法 来 分 析 数 
据 , 并 能 对 数据 做 出 有 实际 意义 的 解释 :实验 设计 指导 如 何 分 析 数 据 ， 而 数据 分 





EJ 









































Cp xxHUSHHEBIBS 20 个 尖端 发 明 ， BERRIES "LIU: 塑料 A TAERE, 爱 
因 斯 组 的 相对 性 理论 ,血型 ERRORI, 电视 , 植物 的 品种 改良 , 通讯 系统 , SR. LS, TR 
TRAD, BED, 治疗 精神 病 约 药 . 真空 管 (电子 管 )， 计 算 机 ， 量 休 管 ,统计 学 (论述 什么 是 
盐 实 ,什么 是 来 犁 偶然 性 的 学 问 ), DNA 和 油光 
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析 品 示 实 
在 统 


验 设计 的 结构 ， 
计 学 发 展 的 初期 ,其 研究 的 问题 多 数 是 从 生物 学 中 产 牛 出 来 的 , 与 此 相 

















应 , 在 让 业 生产 中 对 统计 学 的 应 用 也 小 规模 地 发 展 起 来 , 休 哈 特 (Shewhart, 1931) 


通过 控制 
测验 异常 

除了 
没有 系统 
大 似 然 估 
出 适当 的 
这 个 问题 
法 更 适合 
称 他 们 的 


图 可 进 简单 的 图 形 程 序 来 测验 生产 过 程 中 的 变化 ,这 个 方法 可 以 说 是 对 
(ÉL, GL CMT CR 

在 舍 计 更 论 中 一 些 基 相 概念 之 外 , 费 吹 提出 的 很 多 方法 是 基于 直觉 的 ,并 
的 统计 推断 理论 . 费 歇 定义 了 一 敏 性 .有效 性 和 充分 性 的 概念 ,并 引进 极 
计 方法 .内 曼 和 阿 ' 皮 尔 森 二 1928 牛 ( 参 见 他 们 的 合 著 论文 ) 讨 论 了 为 导 
统计 方法 ,特别 是 在 假设 恰 验 中 要 设置 一 些 公里 的 门 题 . 沃 尔 德 (1950) 对 
进行 了 更 深 人 的 研究 并 把 其 完善 为 一 种 决策 理论 . 费 歌 坚持 认为 他 的 方 
于 科学 推断 , 而 内 问 各 沃 尔 德 的 思想 只 适合 技术 的 应 用 , 虽然 后 者 声 
理论 普遍 有 效 . 沃 尔 德 在 抽样 调查 的 应 用 中 开发 了 序 贯 法 ， 费 砍 认 为 这 




















个 方法 也 





据 随机 选 





可 用 于 生物 学 ,1 在 印度 统计 所 所 做 的 一 次 演讲 中 , 费 歇 把 休 哈 特 的 控制 


图 , 活 尔 德 的 序 贯 抽样 相 抽 样 调 查 作为 统计 方法 论 中 一 个 重 旨 的 发 展 . ] 
进入 20 世纪 40 年 代 后 可 以 看 到 抽样 调查 方法 的 发 展 . 这 种 方法 是 调查 者 依 





取 的 个 体 对 一 组 问题 的 反应 所 获取 的 信息 来 收集 大 明 的 数据 . 这 种 情形 





To 确保 数据 的 准确 性 (不 带 偏 差 . 记 录 上 的 错误 .反应 错误 )} 利 数据 的 可 比较 性 
(在 各 研究 者 之 间 , 或 不 同 的 调 信 广 法 之 间 ) 这 样 一 些 问题 被 认为 是 至 关 重 要 的 . 马 


哈 拉 庶 比 
到 的 偏 美 


斯 (Mahalancbis)(1931, 1944) 或 洗 是 第 “个 认识 到 在 抑 样 过 程 中 上 述 提 
` 记 录 误 差 等 是 不 可 避免 的 , 甚 件 比 抽样 误差 更 严重 ,他 提出 在 设计 调查 





过 程 时 , 应 该 采取 一 些 步骤 和 方法 米 控制 和 查 明 这 些 误差 , 并 发 展 适当 的 检验 称 
序 , fric Seo i Fer Hh iE CURE Or TB RU FEE BER. 

至 此 , FELICES TRES ERI BEL AAT BE 2) E EXEAT ERE RUE 
论 统计 学 . 度 用 统 i 学 者 们 感到 十 分 需要 的 是 清除 那些 有 缺陷 的 数据 , 这样 的 数 
据 有 可 能 使 统计 分 析 所 得 到 的 推断 无 效 .这 里 所 需要 的 可 能 是 一 综合 处 理 方法 ， 
首先 提供 分 析 方 法 去 止 确 地 理解 给 定 的 数据 及 其 缺陷 和 特征 , 然后 去 选择 数据 分 
析 合适 的 随机 骨 率 模型 或 是 模型 族 ,使 其 不 但 能 解 凑 特 狐 的 问题 而 且 能 开发 进 一 
步调 檀 研 究 的 新 课题 .在 这 个 方向 上-- 步 重要 的 发 展 是 由 图 基 (Tukey) 在 1962 年 
AL 1977 FELE, UA RAEE Mosteller) MAR ATE 1968 年 的 论文 中 做 
出 的 ,他 们 提出 了 被 称 为 是 探索 数据 分 析 EDACExploratory Data Analysis) 的 方法 . 
EDA 的 哲学 原理 足 了 解数 据 的 基 木 特征 ,然后 运用 稳健 过 程 使 数据 适应 可 能 的 
更 广义 的 随机 概率 模型 族 , 代替 结 求 什么 样 的 综合 统计 量 对 指定 的 随机 概率 模型 
是 合适 的 费 欧 问 题 ,图 基 提出 求 给 定 一 个 综合 统计 其 对 什么 伴 的 随机 概率 模型 族 
是 合适 的 问题 .这 个 方 商 也 可 参考 全 特 非 德 CChatfied, 1985) 描 述 的 初始 数据 分 析 ， 
这 种 分 析 似 乎 是 措 述 数据 分 析 的 扩展 ,人 在 最 小 限度 利用 传统 的 统计 方法 的 意义 下 
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基于 常识 和 经 验 做 出 推断 ， 

图 3.1 展示 了 统计 数据 分 析 的 各 个 步骤, 这 是 基 十 我 白 己 在 分 析 处 理 大 量 数 
据 时 所 获得 的 经 验 做 成 的 , 我 的 这 各 方法 似乎 综合 了 上 面 提 到 的 卡 ' 皮 尔 森 的 描 
述 数 据 分 析 、 费 软 的 推断 统计 和 图 基 的 探索 数据 分 析 , 以 及 马 哈 拉 诺 比 斯 关于 非 抽 
样 误差 的 工作 . 
图 3.1 中 ,数据 表示 测定 值 (或 观察 值 ) 的 全 部 集合 ,如 何 由 实验 ,抽样 或 是 历 











特定 问题 的 模型 化 
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数据 收集 技术 实验 设计 历史 资料 IE 
(LAR RAIA) 
数据 
如 何 获得 新 的 测量 值 


MELE. 专家 意见 . 先 验 信息 


























数据 的 交叉 检验 (CRD) 
Dig 
《异常 值 、 误 差 、 偏差 、 擅 造 数据 的 恰 
iis Xue ser. SEARE, Pr 
征 及 有 效 总 体 表示 的 检测 》 
建 模 
随机 模型 的 选择 或 特征 化 


(交叉 核实 法 ;如 何 利用 专家 意 












































见 和 己 有 的 知识 、 内 叶 斯 分 
p) 
HER BARS BTID A) 
* 
假设 检验 合计 《点 、 区 间 ) 决策 
媒介 分 析 综合 统计 量 图 表示 
t 
对 进一步 调查 分 析 的 导向 - 











图 3.1 统计 数据 分 析 的 步骤 





3.2 HR Ne I 


SIERE YON, HARR RMR HRI, A ERAT RE eB R ARB 
机 概率 模型 的 先 验 信 息 (包含 专家 意见 ) 等 都 包含 在 内 - 

数据 的 交叉 检验 CED(Cross Examination of Data) 表示 任何 探索 或 初始 研究 都 
是 为 了 了 解数 据 的 性 质 ， 剔除 测量 误差 .记录 误差 和 异常 值 ,检验 先 验 信息 的 有 
效 性 , 检测 数据 的 真 伪 . 数 据 的 初始 饶 究 也 用 于 检验 一 个 指定 异 现 的 有 效 性 或 十 
对 进一步 的 数据 分 析 选 择 一 个 更 合适 的 随机 概率 模型 或 随机 概率 模型 族 

推断 数据 分 析 IDA《Inferential Data Analysis) 表 示 基 于 对 观察 数据 所 选 定 的 
随机 概率 模型 所 进行 的 估计 ,项 测 ,假设 检验 和 决策 推断 等 统计 方法 的 综合 .数据 
分 析 的 年 的 不 仅仅 只 限 汪 解答 某 些 特殊 的 问题 ,而 是 要 从 数据 中 获取 一 切 有 效 信 
息 .数据 中 常常 含有 对 新 的 研究 导向 有 价值 的 信息 , 同时 含有 为 收集 数据 改进 木 
来 的 实验 设计 或 样本 抽样 的 有 价值 的 信息 . 我 将 数据 分 析 的 主要 原理 用 -个 基本 
方程 式 明确 给 沿 

Baki] = (Eee + [提供 新 研究 方向 的 信息 

A 3. 1 所 示 的 数据 分 析 的 程序 中 ,不 应 把 数据 的 交 义 检验 和 推断 数据 分 析 作 
为 适用 不 同方 法 的 不 同 的 范 哮 . 它 仪 仅 表明 当 我 们 面 对 数据 时 我 们 应 如 何 并 始 ,以 
什么 形式 表示 最 终 的 结果 以 及 如 何 应 用 实际 .推断 数据 分 析 的 某 些 结果 或 许 提 
示 进 … 步 的 数据 交叉 检验 ， 这 时 也 去 示 推 断 数据 分 析 的 结果 会 发 生变 化 . 

数据 分 析 的 -个 重要 方面 是 不 可 使 用 任何 没有 被 当前 数据 或 过 去 经 验证 明 的 
额外 假 商 .这 时 出 现 的 问题 是 : 专家 的 意见 在 数据 分 析 中 起 什么 作用 .我 的 回答 是 

如 果 专 家 的 意见 是 正确 的 ,我们 可 以 从 中 获 益 ; 如 果 不 正确 ， 听 一 
听 也 无 害 . 


内 此 ,专家 的 意见 在 计划 -个 抽样 或 设计 一 个 实验 时 是 有 用 的 . 























3.2 ”数据 的 交叉 检验 
数字 本 身 不 会 说 说 ， 但 说 说 者 却 需要 算计 . 
HF RMC. H. Grosvenor) 4 € 

统计 学 者 经 常 被 要 求 去 分 析 他 人 所 收集 到 的 数据 . 按 费 加 的 说 法 ， 这 时 ，- 一 
个 统计 学 者 首 归 的 工作 是 利用 数据 的 交叉 检验 (CED)( 让 数字 说 话 的 艺术 ) 来 获得 
对 数据 有 意义 的 分 析 和 用 于 解释 结果 的 一 切 必 此 的 信息 .在 大 的 范 赎 内 对 每 个 小 
范畴 的 特 珠 需求 进行 数据 交叉 检验 时 , 一 个 可 供 采 用 的 愉 仁 项 日 有 如 下 儿 种 : 

* 数据 是 如 何 收集 .记录 的 ? 

x "supr AM ue Dee ig t Xu o H EN HE Ae 观 
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察 值 之 间 存 在 任何 区 草 吗 ? 

* 数据 是 真实 的 , 即 是 所 调查 的 原样 ,还 是 以 任何 方式 经 过 人 工 伪造 ,编纂 
或 收 改过 的 ? 是 否 出 观察 者 自行 决定 删除 了 任何 观察 值 ? 数据 中 是 天 存在 
任何 或 许 会 过 度 影 响 统计 推断 的 异常 值 ? 

* 提供 信息 的 观察 数据 是 来 自 什么 样 的 实施 总 体 ? 作为 抽样 调查 总 休 中 所 
选 定 部 分 是 否 存在 没有 问答 的 (部 分 或 全 部 )? 数据 信息 是 来 自 单 一 总 体 ,还 
是 混合 总 体 ? 与 抽出 样本 单位 的 识别 和 分 类 有 关 的 因素 都 记 录 下 来 了 吗 ? 

* 对 所 要 调 售 癸 究 的 课题 或 是 观察 数据 的 性 质 是 理 存 在 任何 先 验 信息 ? 

通过 下 接 与 收集 数据 的 调查 者 灾 谈 可 以 得 到 上 述 某 些 问题 的 答案 ; 但 是 对 其 

余 的 部 分 , 则 不 得 不 通过 对 数据 的 适当 分 析 来 获得 答案 , 即 把 问题 代入 数据 或 是 
对 数据 进行 灾 叉 检验 米 获得 答案 ,这 时 ,通过 直方 图 , 维 散 点 向 等 数据 向 示 , 通 
过 适当 的 变换 所 得 的 测量 值 的 概率 坐标 图 以 及 某 些 描述 统计 量 的 计算 部 是 非常 有 
帮助 的 ,这 些 都 不 是 例行公事 ,然而 ,数据 交叉 检验 成 功 与 告 很 大 程度 上 依赖 于 数 
据 的 性 质 , 以 及 从 这 些 数据 (让 数字 说 活 ) 中 抽取 信息 时 统计 学 者 本 身 技能 . Pan 
我 将 给 出 几 个 实例 . 





3.2.1 REHAR 


证 我 们 来 看 表 3.1, 选 白 福克斯 .已 尔 和 埃 尔 夫 伯 克 (].P. Fox, C.E. Hall 和 
L. RElveback) 所 着 《防疫 学 入 类 利 疾病》 - 书 的 第 74 页 . 
RIL 1846 年 法 拉 岛 麻疹 流行 期 发 病人 数 , 死 亡 人 数 及 其 年 龄 分 布 统计 











FROS) An 发 病人 数 发 病 率 ( % ) 死 广 数 SEV EC) 
<1 198 154 71.8 44 28.6 
1~9 1440 117 77.7 3 0.3 
10~19 1525 1183 77.6 2 9.2 
20-29 1470 1140 11.6 4 0.3 
30—39 842 653 11.6 10 L5 
40—59 1519 1178 7.6 46 3.9 
60—79 752 583 77.5 46 7.9 
80+ à H8 92 78.0 15 16.3 

和 7864 6100 77.6 170 2.8 





米 源 : P.L. Panum: Observations Made During the Epidemic of Measles on the Faroe Islands in 
the Year 1846, Delta Omega Society, New York, p. 82,1940. 


TERETE HELE : “RIBS NY BRIAR o SR 4 AE A ABEL, 但 死亡 率 却 有 
BEAR. SU Pea, TAS 30 E SEARS Te ee EE 
绪 沦 有 效 吗 ? 
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表 3.1 中 值得 引起 注意 的 是 8 个 年 龄 组 各 自 的 发 病 闪 与 总 体 的 发 病 率 
77.6% 几 乎 没有 准 别 ,或 是 只 有 很 微小 的 差别 . 如 果真 的 发 病 率 对 所 有 年 龄 组 是 相 
问 的 ， 这 种 现象 是 偶然 发 生 的 鸣 y 这 里 很 值得 怀疑 的 是 : 各 个 年 龄 纪 的 麻疹 发 病 
数 不 是 观察 得 来 的 , 而 是 构造 出 米 的 . 出 总 发 病 率 6100/7864 = 0.776 FE LAA 
NUNT, 再 四 会 站 人 大 最 近 的 整数 得 到 各 组 的 发 病 数 .例如 ,1 岁 以 下 以 及 SO 
岁 以 上 了 个 组 的 发 病人 数 可 这 和 样 获得 : 

198 x 0.776 = 153.648 ~ 154; 118 X 0.776 = 91.568 ~ 92… (3.1) 
MRH PEAR FARALAR, BERE FR: 
154/198 = 0.7777 ~ 0.778; 92/118 = 0.7796 œ 0.78 (3.2) 


这 些 数 字 与 起 3.1 中 作者 所 报告 的 数字 完全 一 样 , 同 时 也 说 明 了 为 什么 表 3.1 中 
发 病 率 的 小 数 点 第 三 位 略 有 不 同 的 原因 . 参考 由 -个 知名 的 . 派 往 法 拉 岛 去 防止 麻 
痛 发 病 的 德国 流行 病 专 家 的 德 文 版 原文 报告 , 帆 纳 (Panum) 指 出 ,相关 的 发 病 数 
最 先 并 不 是 按 牛 龄 组 分 类 的 ,而 从 德语 德 译 人 到 英语 时 英语 编辑 假定 各 年 龄 组 有 相 
同 的 发 病 率 ,利用 (3. 巧 式 来 构造 出 各 年 龄 组 的 发 病人 数 , 另外, 表 3.1 中 第 4 栏 
PRASA E PRES 87 页 的 表 上 并 木 出 现 , 这 可 能 是 《防疫 学 ， 人 类 和 疾 
A4) 书 的 作者 福克斯 , 惟 尔 和 埃 尔 大 从 克 出 (3.2) 式 计算 得 到 的 . 出 此 看 米 , 从 构 
造 各 年 龄 组 的 发 病 数 而 得 到 的 各 组 年 龄 的 死亡 率 和 所 得 的 结果 的 解释 不 - 定 是 有 
效 的 ，- 个 统计 学 者 常常 被 贤 求 到 做 侦探 性 的 工作 ! (另外 , 1 一 9 岁 一 组 的 发 病 率 
Ri 77.6%, ARSE 77.7961) 


3.2.2 测量 误差 , 记录 误差 与 异常 值 


AIER I BUB, 测 嚼 和 记录 上 的 误差 是 不 可 避免 的 .如 果 这 些 值 并 不 
ESHA RARA, 疲 检 测 出 它们 通常 是 很 困难 的 . FA, 在 设计 调查 时 ， 
要 特别 注意 使 这 样 的 误差 降 到 最 小 . 在 调查 测量 中 当 出 现 一 个 可 疑 的 数字 时 , 带 
有 审查 的 程序 会 向 调 在 者 发 出 警告 ,并 容许 调 代 者 重复 测量 以 及 调 得 被 测量 的 个 
体 值 是 否 属于 被 研究 的 总 体 . 

笔者 有 机 会 详 察 了 大 量 有 关 人 类 测 县 学 抽样 调 个 所 得 的 数据 .其 中 有 一 例 是 
不 得 不 放弃 化 高 额 代价 收集 来 的 全 部 数据 (Mukherji，Rao, Trevor (1955); 
Majumdar, Rao(1958) ) . 当 测 旺 多 变量 响应 数据 时， 如 果 记 录 和 测量 误差 的 数量 不 
多 , 由 各 个 测量 值 太 比值 所 描绘 的 青 方 岗 ， 或 是 由 一 弓 变 量 测 基 值 所 得 到 的 一 维 
散 点 图 以 及 计算 各 测量 值 集合 的 前 由 阶 守 , 偏 度 y, 和 峰 度 % 都 可 以 检测 出 记录 
误差 和 测量 误差 .特别 是 偏 度 和 峰 度 对 措 常 值 很 敏感 . 才 3.2 给 出 了 由 不 同 总 体 抽 
伴 所 获 原始 数据 计算 得 到 的 偏 度 和 峰 度 , 一 些 总 体 特 征 在 除去 极 值 后 再 计算 节 它 
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们 的 偏 度 和 峰 度 .各 总 体 的 样本 大 小 约 为 50. 带 有 * 号 的 数字 表明 在 5% MK 
FTE TAH. 可 以 看 到 ,此 时 除 到 一 个 级 值 后 再 计算 入 度 和 峰 度 ,结果 就 与 其 他 
情况 下 所 得 的 一 致 了 . 


R32 五 个 男子 部 落 中 一 些 人 类 学 特征 测量 值 的 偏 度 y, 和 峰 度 y, 的 统计 检验 
{ 选 自 Urmila Pingle 的 博士 论文 } 


特征 KOLAM KOYA 


Y 


SEH KE 0.15 


FHKE - 0.14 


LEK 0.83" 


0.14 
ERKE -0.26 
EEKE - 0.05 





DERE -217 
0.08 





n b 





-0.62 0.39 


0.06 0.48 

2.93 0.17 
一 0.03 

一 0.07 0.44 

-0.63 195" 

-0.30 

9.98" —0.07 
- 0.62 





男子 部 落 
MANNE MARIA 
Ya Yi 次 n 
0.37 1.62" 4.54 
0.71" 0.29 
4.12-0.05 -0.08 0.05 
0.19 1.72" 8.42" -0.17 
0.40 0.27 
0.11 0.66 0.32  —0.05 
6.88'-0.01 —0.27 0.13 
0.74 
0.59 0.19 -0.67  —0.02 


Ye 


7 70.27 


0.48 


—0.09 
一 0.63 


70.10 
0.76 


0.28 


n 


-0.32 


0.12 


-0.04 
0.14 


- 0.06 





9.28 
-0.61 


—0.24 
—0.49 


-0.07 


-0.30 0.23 





注 : 每 一 特征 值 的 第 一 行 表示 除去 极 值 后 的 计算 结果 . 


和 二 元 平面 图 能 够 帮助 我 们 检测 数据 中 的 异常 值 和 数据 
高 线 绘图 机 能 的 存在 ,统计 学 考 们 已 经 能 在 统计 分 析 中 
通过 各 种 图 形 显示 来 更 有 效 地 处 理 数据 . Cleveland(1993) 出 版 了 一 本 较 好 的 关于 


简单 的 图 示 如 直方 
类 型 . 今 大 , 由 于 计算 书 

















BUPA AMS Si. BK 1925 年 在 他 的 《研究 者 的 统计 方法 》 一 书 中 强调 了 在 


数据 早期 检测 时 图 形 的 本 








问世 ,可 视 性 变 得 更 确定 .更 有 效 了 .， 
3.2.3. 数据 的 伪造 


政府 对 积累 统计 数字 非常 热心 .政府 收集 数据 , 把 数据 累计 相 加 , 进 
fin KE, 开 三 次 方 等, 并 做 出 漂亮 的 图 形 .但 决 不 要 忘记 的 是 这 些 图 形 
所 基于 的 每 一 个 数字 首先 来 自 乡 村 统计 员 , 这些 乡村 统计 员 可 随心 所 从 
地 写 下 任何 数据 . 


斯 坦 草 一 士 ( 花 花 公 子 ，1975 年 1 月 ) 
越 多 的 欺诈 暴露 于 公众 ， 听 到 的 却 是 越 静 悄悄 的 处 理 ,， 这 不 得 不 使 


要 性 . 随 着 图 基 (1977) 的 葛 基 性 论文 (探索 数据 分 析 ) 的 
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我 们 怀疑 在 科学 中 欺诈 是 否 是 一 般 的 特征 . 

布 罗 德 和 市 德 (W. Broad and N. Wade, CE r4 646)» 

搂 受 一 个 新 的 理论 , 依 顿 于 对 观察 数据 的 验证 ， -个 科学 家 有 时 会 被 引诱 去 
编造 些 实验 数据 来 拟 合 “个 特殊 的 理论 ， 从 而 要 求 承认 他 的 主张 或 建立 他 的 优 
FOL ELR, 如果 个 理论 是 错 的 , 其 他 做 类 似 实验 的 科学 家 们 迟早 会 发 现 . 
然而 有 可 能 在 这 个 理 沦 被 接受 的 那 段 时 间 , 社会 已 受到 --- 些 危害 . 最 近 一 个 例子 
是 "智商 指数 的 菊 师 (IQ Fraud)"(《 今 日 科学 》,1976 年 12 H, 第 33 页 .) 涉 及 到 伯 
FCC. Burt) ,他 被 称 为 是 英国 教育 心理 学 之 父 .按照 伯 特 的 理论 , 人 的 智商 的 差别 
EEREN, 不 受 社会 兴 素 的 影响 ,他 的 理论 明显 是 由 伪造 数据 所 支持 , 这 会 
影响 政府 按 错误 的 方向 来 考虑 儿童 教育 . 

如 何 检测 所 给 出 数据 的 真 伪 呢 ? 统计 学 系统 中 包含 有 判别 数据 真 伪 的 数据 分 
析 方 法 吗 ? PARER TH RLE, 最 近 儿 年 有 的 统计 学 者 已 经 检验 了 过 去 
由 某 些 善 名 科学 家 所 生成 和 使 用 过 的 数据 ,并 且 发 现 了 有 些 “ 并 不 是 非常 减 实 的 ， 
那些 科学 家 所 得 到 的 数 撕 并 不 总 是 他 们 报告 的 结果 ," 替 尔 顿 (Haldane，1948) ff 
di: 




















人 类 是 一 种 常规 动物 ， 并 不 能 模仿 自然 界 的 无 序 . 


基于 人 类 大 脑 的 这 个 局 限 , 统计 学 省 山 经 发 展 了 检验 伪 数 据 的 技术 .笔者 曾 同 统 
计 学 专业 -- 年 级 学 牛 共 同 进 行 了 下 列 实 验 来 验证 答 尔 顿 的 观察 结果 . 
我 让 学 生 做 了 下列 实 验 . RIK 3.3. 
表 3.3 不 同 实验 的 结果 














男子 数 实际 数据 _ 期 望 值 E c 
(每 5 个 一 组 ) 医院 ”模拟 数 (二 项 分 布 ) (A) (B) 
o a) (2) (3) _ (4) o H 6 
0 2 5 6.25 2 5 
1 26 27 31.25 20 32 
2 65 64 62.50 78 63 
3 ao 68 62.50 $8 4 
4 31 32 31.25 17 33 
u 5 9 4 625 3 6 
总 数 200 — 200 200.00 — “200 20. 
Pa 2.1 248 23.87 0.54 





CO 投掷 1000 次 硬币 , 5 UC— £H SL WL RES 3 栏 , 模拟 数 ). 
GD 记录 某 产 科 医 院 连 线 出 汪 的 200 个 婴儿 ,记录 得 5 个 -组 中 男 遇 的 人 数 
( 见 表 中 第 2 栏 ,医院 ). 
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Gii) BUR TE TEBEDE- Tr GE TD, Hot PAAR HS 1000 次 结果 , LAS Po Hitt 
正面 朝 上 的 数字 ( 见 表 中 第 5 栏 ,假想 数据 (A)). 
(v) 对 一些 还 没有 学 二 项 分 布 的 学 生 , 我 告诉 他 们 人 很 起 授 撞 使 币 以 5 次 为 
一 组 ,什么 是 我 期 单 的 每 红 中 正面 明 上 的 频率 分 布 值 ( 见 表 中 第 4 RE), 
然后 证 这 些 学 后 写 下 他 们 假想 投掷 硬币 1000 次 .正面 朝 上 的 结果 ( 见 表 
中 第 6 栏 ， 假想 数据 (B) ) 
由 表 3.3 LUE SI, A HRA 5 的 上 方 检验 值 对 实际 观察 数据 TA A aE 
是 合适 的 . 卡 方 检验 值 在 假想 数据 (A) 的 情形 下 太 大 , 这 是 由 于 学 乍 想像 男女 的 平 
衡 所 造成 的 ， 庙 不 是 来 白 随机 性 地 考 处 ,对 假想 数据 (B) 的 卡 方 愉 验 值 来 涪 是 难 
以 想像 的 小 ,这 是 机 上 学 竺 努力 全 数据 拟 合 已 知 的 期 齐 值 . 
现在 我 们 米 看 下 备 德 尔 的 实验 所 产生 的 原始 数据 , 基 二 这 些 数 据 正德 尔 公 
式 化 了 性格 特 征 遵 传 法 则 ,建立 了 造 传 学 的 其 铅 . 费 歌 在 他 的 一 项 著名 研究 中 ( 参 
见 《科学 年 鉴 》,1936 年 第 一 卷 , 第 115 137 页 ) 检 验 了 这 些 数据 . 费 苏 计算 了 竺 德 
尔 的 理论 值 和 多 组 实验 中 观察 值 的 准 的 上 方 检验 值 ， 其 结果 你 在 表 3.4 中 . 
R34 重 德 尔 实验 产生 的 观察 秆 与 期 望 值 偏差 的 卡 方 窒 验 值 和 概率 























检验 假设 的 实验 自由 度 卡 方 值 如 (观测 值 》 POC > yb) 
00 RX31 7 2.1389 0.95 
比率 2:1 8 5.1733 0.74 
AHF 8 2.8110 0.94 

BRER 15 3.6730 0.9987 

二 因子 26 .324 0.95 O 

小 和 64 29. 1186 0.99987 
植物 引起 的 变动 2 12.4870 0.90 

总 和 84 41.6056 0.99993 





可 以 看 到 , 3& 3.4 dci PREF AE AL, AR AT E 
论 结果 非常 接近 ,数据 有 可 能 是 伪造 的 ”5 个 实验 总 体 这 样 好 的 拟 合 的 可 能 值 仅 
为 


1 - 0.99993 = 7/100000 
这 个 值 非常 小 , 费 软 对 这 样 军 网 的 偶然 发 后 事件 , 作 了 如 下 评价 ， 
尽管 不 能 期 待 有 任何 邻 人 满意 的 解释 ,但 仍 有 可 能 的 是 更 德 尔 被 他 
WEM NOR T, 这些 助手 太 了 解 什么 是 下 德尔 所 期 望 的 结果 .这 种 
可 能 已 经 由 别 的 独立 的 实验 证 实 : 形成 表 3.4 的 实验 数据 的 绝 大 部 分 ， 
KERR iE, CAR HSK OMB. 
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BEAR (1948) HAE T A TP OB TERES EH RO, 显示 这 些 数据 与 假 
imb e — S. ERAEN, AIRE 十 分 了 解 一 个 统计 学 者 使 用 什 
么 样 的 检验 来 检测 伪造 的 数据 , 那么 这 个 实验 者 就 可 以 这 样 来 伪造 数据 , 使 这 些 
数据 在 统计 者 的 检验 蛙 看 起 来 是 无 可 怀疑 的 ,市 已 在 抽样 误差 的 极限 范围 内 证 明 
他 提出 的 理论 . 欠 尔 顿 称 这 种 手段 为 -次 伪造 .例如 , 如果 一 种 理论 假设 两 种 类 型 
事件 发 生 的 比率 为 3:1, 那么 总 是 可 以 选择 两 个 数 使 其 比值 既 不 接近 3:1 也 不 远 
离 3:1,， 央 而 与 理论 值 偏差 的 卡 方 值 不 会 太 大 也 不 会 太 小 .然而 ,检测 出 这 样 的 一 
次 念 造 数 据 的 统计 方法 是 存在 的 . 

我 曾经 要 求 我 的 -DEFRA RHE :个 有 50 个 也 和 T 的 假想 序列 , 米 证 
BAH AT EJ 1:1 比率 山 现 的 理论 , 而且 不 要 让 两 洗 看 起 来 太 接 近 以 免 让 人 生 疑 . 
这 个 同事 给 了 如 下 的 序列 , 其 中 含有 29 PH, 21 T. 

THTHTHHTHH 
HTTHTHTHHH 
THHHTHTITT 
HHTTHTTHHH 
THHTTHHHTH 
观测 信 与 假设 的 1:1 URBE IC" REIS UE REB Jn RERA 
x? = (29 - 25) 125+ Q1 - 25) [28 = 1.28 
与 月 由 度 为 1 的 下 方 值 比较 ,这 个 值 既 不 大小 让 人 怀疑 数据 是 盆 造 的 ， 也 不 太 大 
以 致 于 否定 假设 的 理论 .另外 , 我 们 可 以 看 到 上 面 5 行 ， 每 行 含有 107 HAT, 
各 行 含 有 HH 的 数 日 为 6, 6, 5,，6,，6 ,与 偶然 情况 下 所 期 望 的 值 比 较 , 这 些 什 似 乎 
过 于 均匀 ,实际 上 , 这 些 值 的 卡 方 值 为 
x? =25+25+0+25+25= 8/5 = 1.6 


与 自由 度 5 下 的 卡 方 值 比较 , ELEA, 显示 了 所 请 的 “二 次 伪造 ”. 

根据 市 斯 特 福 水 CR. S，Westfall,《 科 学 》, 第 179 卷 , 第 751 一 758 Xt, 1973) 
的 看 法 : 发 现 万 有 引力 的 秆 轻 人 牛顿 是 操纵 驱 测 值 的 行家 , 他 能 让 观测 值 正 好 与 
他 的 计算 值 吻合 . 书 斯 特 福 尔 在 他 的 文章 (Princpia) 中 ,引出 了 3 个 具 本 例子 .为 了 
证 明 地 球 表面 的 重力 加 速度 与 它 轨道 上 月 党 的 向 它 加 速 境 相等 ， 牛 顿 分 别 计算 了 
地 球 表 面 的 重力 加 速度 为 


15 ER, 1 英寸 1 吉英 线 











和 和 月亮 的 向 心 加 速度 
15 英尺 工 英寸 1 lisa 
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1 英 线 = 1/12 英寸 , 两 首相 比 ， 差 仅 为 : 千 分 之 一 (1/3000) .声音 的 速度 估计 为 
每 秒 1142 英尺 ， 精 确 度 为 千 分 之 牛顿 并 估计 了 精确 度 为 S9"01"12" 的 恒生 平 
分 点 , 其 精确 度 也 为 三 千 分 之 一 .这样 高 的 精确 度 对 牛顿 时 代 的 观测 技术 水 平 来 
说 荐 前 所 未 阅 的 . 

HPW. Broad ABEN. Wade) $3889 (ECBEBUTPBO [17 Jj der Pi deer" 
一 章 星 还 提 到 了 其 他 著名 科学 家 的 和 名字. 这 里 我 引用 几 段 ， 

* 托 勒 密 (C，Ptolemy) 一 一 -被 称 为 是 “古代 最 伟大 的 天 文学 家 ", 他 的 绝 大 多 
数 天 文 观测 不 是 夜间 在 埃及 海岸 进行 的 , 而 是 中 天 在 亚 力 山大 市 的 大 图 
书馆 中 进行 的 .他 次 省 了 一 位 古 项 腊 天 文学 家 的 著作 ， 并 不 断 把 这 些 称 为 
是 他 自己 的 傅 究 结果 . 
伽利略 一 一 益 是 被 称 为 近代 科学 方法 之 父 ， 这 足 因 为 他 坚持 认为 不 是 业 
里 二 多 德 的 著作 而 是 实验 ， 才 是 真理 的 仲裁 .但 是 这 位 17 世纪 意大利 物 
理学 家 的 同僚 们 因为 非常 由 难 再 现 他 的 实验 结果 , 而 怀疑 他 是 否 真 的 做 
了 那些 实验 . 
道 尔 顿 Q .Dalton) 一 一 19 此 纪 伟 大 的 化 学 家 ,他 发 明了 化 学 链 法 则 并 证 
明了 不 同 种 类 原子 的 存在 ， 并 发 表 了 一 系列 高 深 的 实验 结果 ,但 是 当代 的 
化 学 家 没有 一 个 能 再 现 他 所 发 表 的 实验 结果 . 
密 立 根 (RMilikan) 一 一 美国 物理 学 家 , rl T fib i ou B T n PA Hi Td 
荣获 漠 贝 尔 (Nobel) 奖 .但 是 为 了 计 他 的 实验 结果 看 起 来 比 实际 结果 更 具 
说 服 力 , 他 大 量 伪造 了 他 的 工作 . 

为 什么 某 些 著名 的 科学 家 要 去 复 改 事实 呢 ? 如 果 这 些 科学 家 更 诚实 一 点 凡 的 
话 , 会 产 牛 什么 样 的 结果 呢 ?《 这 些 疑 问 是 戈 十 博 十 提出 的 . 区 上 博士 曾 为 印度 统 
计 饰 究 所 的 所 长 . ) 

为 了 回答 这 些 问题 , 大 们 必须 认识 科学 发 明 的 几 个 方 而 一 一 首先 找 出 事实 
(数据 信息 ) UG BUE -个 理论 或 是 - -种 法 则 去 解释 事实 和 现象 ,以 及 科学 家 们 
期 望 建立 优先 权 去 获得 四 行 的 承认 利 由 这 种 藉 认 所 得 到 的 利益 . 当 一 个 科学 家 确 
信和 他 的 理论 时 , 便 存 在 一 种 诱 感 ， 使 得 他 去 寻找 "事实 ?或 焉 昌 事 实 以 便 拟 合 他 自 
已 的 理论 . 在 可 接受 的 误差 范围 内 与 理论 一 致 的 概念 , 丰 拓 假设 检验 的 统计 方法 
出 现 之 前 , 是 不 存在 的 . 可 以 认为 : ~- 个 与 数据 信息 更 接近 的 结论 意味 着 更 准确 
的 理论 和 更 使 人 信服 的 证 据 来 使 同行 接受 .由 十 统计 思想 的 出 现 , 现在 我 们 已 经 
认识 到 一 一 过 于 与 数据 信息 接近 的 结果 ,可 能 意味 着 是 个 伪造 的 理论 ! 近代 ， 
也 有 很 多 关于 伪造 数据 来 建立 错误 的 假设 结果 的 例子 , 如 前 疝 提 到 的 英国 的 伯 特 
历 士 .这 些 已 经 对 社会 和 科学 的 进步 产 牛 了 - - 定 的 危害 . 
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3.2.4” 拉 查 尼 (Lazzarini} 和 x 的 估计 


第 BEM, 我 已 淡 到 可 以 怎样 利用 随机 数 的 蒙特 卡 罗 醒 拟 方法 使 我 们 来 解决 
一 些 数学 上 很 赤 手 的 复杂 问题 ， 例 如 计算 复杂 的 税 分 、 复杂 图 彤 的 面积 ` 木 知 参 
数 的 估计 等 等 .下 击 我 将 叙述 蒙特 下风 法 的 一 个 有 趣 的 应 用 ， 如何 对 辐 的 周 长 与 
ROI EC «的 估计 , 这 里 
x = 3.14159265--- 

Ai d ERE CALEB + (Buffon) FEBRE. 18 世纪 ,法国 的 自然 科学 家 薄 二 
计算 出 :随机 朴 掷 一 根 长 度 为 L KERRAK a (>L) 的 平行 线束 时 ， 共 名 OT 
行 线 相交 的 概率 为 p = 2 /ra .如果 我 们 随机 重复 多 次 投掷 HET, 当 投 掷 次 数 
N 很 大 AH SRA RAT, MRE p 的 信 计 为 RIN, RIS N >o 
Bp, 几乎 必然 成 立 





RIN >p 


也 就 是 说 当 N KM, RIN SSF p. 的 蒙特 卡 岁 估计 值 可 由 渐进 方程 
RIN ŽE 得 到 (这 里 给 定 Lja), 则 的 一 个 近似 值 为 


i (F) 
如 果 没 有 任何 确定 x 的 计算 方法 时 , 可 从 公式 (记得 到 一 个 合计 值 , 此 时 仪 需 要 
KEW LB RAUA - 张 描 出 了 问 隔 为 a 的 平行 线束 的 纸 , 以 及 相当 的 附 心 去 机 
械 地 iu De SEHE AL. 
-- 些 人 已 有 耐心 大 做 过 这 种 实验 并 报告 了 他 们 所 得 的 x 值 .当然 , 所 有 的 实 
验 并 不 产生 同样 的 结果 , 但 如 果 N 变 天 时 ,不 同 的 这 些 值 会 很 接近 , Bic, 德 
国法 兰 克 福 的 沃 尔 夫 教 授 在 1850 -- 1860 10 年 间 , 把 --- 根 长 为 36 SOR WERE 
了 5000 次 , 平行 线束 的 间隔 为 45 毫米 ,观察 到 针 利 线 相 交 的 次 数 为 2532 次 , 利 
用 公式 (F) ,得 到 一 个 估计 值 为 x = 3.1416, 其 误差 为 百 分 之 零点 六 .据说 从 
1890 年 到 1900 fl, -一 个 叫 福克斯 的 人 “非常 小 心地 " 投 搓 了 1200 次 , FEB x= 
3.1419. RAS 的 最 准确 估计 值 的 足 意大利 数学 家 拉 查 尼 (Lazxzarini， 他 的 名字 党 
常 被 参考 他 的 工作 结果 的 后 人 误 拼 写 为 Lazzerini) .他 在 1901 年 的 《数学 期 刊 》 中 
详细 报告 了 他 所 做 实验 的 结果 ,在 3408 次 投 搓 中 , 成功 了 1808 次 , 代 进 (F) 方 程 ， 
得 到 

















1808 2L 5 


3408 " ma 3n 
利用 已 知 Lja = 516, 给 出 的 - -个 估计 值 为 
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101808 _ 5 16x24 
6 3408 ~ 3 16x 11 
这 个 值 与 真 值 的 差 仪 在 小 数 点 后 第 7 位 上. 
注意 到 上 述 计 算 过 程 中 所 出 岗 的 奇妙 的 数字 ,由 这 些 数 宁 河 党 地 产生 出 比值 
355/113 作为 «的 近似 值 , 这 个 比值 被 认为 是 x 含有 小 数 的 最 伟人 理 近 似 值 .( 实 
际 上 ,这 个 值 是 公元 5 性 纪 中 国 数学 家 祖冲之 算出 来 的 . )x 的 另 -个 含有 较 高 位 
数 的 有 理 近 似 值 为 52163/16604. N. T. Gridgeman (Scripta Mathematica, 1961) 和 
T.H. O’Beirne(《 新 科学 家 》，1961) 分 别 调查 了 此 事 , 由 他 们 的 调查 清楚 地 显示 
了 拉 碍 尼 于 的 游戏 . M Lja = 5/6 时 , 为 了 得 到 比率 355/113, RIN 必须 为 
113/213. 这 就 是 说 , 至 少 要 在 213 次 实验 中 ,得 到 113 次 成 功 , 或 是 在 213K 次 实 
验 中 成 功 113K tk, K 为 任意 正 整数 . 在 拉 查 尼 的 情形 中 K = 16. 这 里 考虑 两 种 
可 能 , -种 足 拉 查 尼 一 次 也 没 敌 过 他 文中 详细 描述 的 实验 , 仅仅 报告 了 他 所 希望 
得 到 的 数字 .或 者 , 拉 查 尼 做 了 不 目 213 次 实验 , 硼 到 观察 得 到 他 所 希望 的 成 功 次 
数 趟 停止 实验 . 像 拉 查 尼 做 的 那样 重复 实验 16 次 , 得 到 所 希望 的 成 功 次 数 即 113 
X16 的 概率 为 1/3. 
拉 普 拉 斯 企 他 所 著 的 《概率 的 理论 分 析 ) 一 书 中 写 到 : 
值得 注意 的 是 ， 由 观察 偶然 性 游戏 开始 的 一 门 科学 竟 会 已 经 成 为 人 
类 知识 中 最 重要 的 研究 对 销 . 
拉 普 拉 斯 并 未 提 到 用 来 获得 新 知识 的 技术 有 时 会 被 操纵 几米 支持 个 错误 的 主 
张 .或 许 ,他 一 定 想 到 了 通过 考察 相间 的 偶然 性 的 游戏 , XX FER DEUM Fl ee E 
现 . 


A _ 355 _ 
R= = f 30415929 











3.2.5 ”剔除 异常 值 与 数据 的 选择 利用 


被 认为 是 电子 计算 机 先驱 的 计算 器 发 明 者 英国 科学 家 拜 比 吉 (C、Babbage)， 
1830 年 在 他 所 著 的 《关于 英国 科学 衰退 的 考察 》-- Bip, 把 某 些 科学 家 在 处 理 数 
据 和 使 用 数据 时 所 采取 的 欺骗 态度 分 为 下 列 几 类 ， 

Ci) 修饰 数据 :“ 修 前 那些 与 平均 值 有 极 大 差 蜡 的 观察 值 , 贴补 那些 看 起 来 与 
平均 值 相 比 似乎 太 小 的 值 .” 

GD 加 工 数据 :为 了 使 若 通 的 观测 值 看 起 来 最 正确 而 采用 各 种 各 样 的 救 巧 . 
其 中 之 一 就 是 进行 多 次 重复 观察 , 从 中 从 选择 那些 致 的 ,或 非常 接近 - 致 的 观 
测 值 .如 果 一 个 厨师 不 能 从 100 个 观测 值 中 选择 出 15 或 20 个 所 需要 的 , 他 会 感 
到 很 失望 .” 

(8) 伪造 数据 :“ 从 林 做 过 的 观测 数据 记录 .” 
es, 我 已 痰 到 本 伪造 数据 或 无 中 生 有 产生 的 数据 .下 面 , 将 讨论 处 理 数据 中 所 
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HIR FRAT A AA ER ETA. 

RAS I AU, TIA, NEUFS AA — 8 B8 LUE 
Hé? 处 理 * 异 常 值 " 利 “ 污 染 的 数据 "这 样 的 棘手 问题 属于 现代 研究 的 领域 之 一 . 遗 
PRAJE, 除了 对 上 耐 提 人 到 的 修饰 数据 作 - : 些 有 理化 和 某 些 统计 上 的 调整 以 外 , 全 
今 人 们 还 没有 满意 的 解决 方法 ,或许 , 当 怀疑 存在 异常 们 时 ,应 采取 的 科学 方法 是 
考虑 下 列 几 种 可 能 的 情形 ， 

* 异常 值 足 测 量 或 记录 中 一 个 屋 著 错 庶 的 结果 . 

* 与 异常 值 有 关 的 单位 (或 个 体 ) 并 不 属于 所 研究 的 总 体 , 或 者 与 样 丰 中 其 

他 部 分 有 本 质 的 区 别 . 

* 所 研究 总 体 的 测量 值 的 分 布 为 厚 尾 分 布 , 因而 较 天 值 的 出 现 并 不 罕见 . 

处 理 怀疑 为 异常 值 的 观测 值 的 第 - 步 就 是 验 汪 总 体 中 有 关 的 部 分 如 有 可 
能 ,对 照 上 面 列 出 的 情形 检查 每 一 个 丁 怀 疑 的 部 分 .也 许可 以 找到 合适 的 处 加 方法 
米 处 理 那 些 值得 怀疑 的 异常 值 . 偶尔， 当 再 次 测 基 有 差异 的 观测 值 时 ,会 导致 新 
的 发 现 ! 然而 , 当 某 一 观测 值 被 杯 疑 是 异常 值 时, 这 样 的 验证 , 即 回 到 观测 的 原 
点 , 并 不 总 是 可 行 的 .因此 ,自动 检 索 这 样 的 数据 ,收集 并 记录 补充 信息 是 很 重要 
的 , 当 不 可 能 对 样本 单位 进行 肯 检 验 或 再 检验 费用 太 具 时 ， 人 们 可 依赖 于 纯 统 计 
学 检验 去 确定 : 

x 起 否 从 研究 对 象 的 总 体 中 删除 异常 观察 值 , 而 把 剩 下 的 部 分 作为 通常 的 












































EEA CT BE). 
* 是 否 从 研究 对 象 的 总 体 中 剔除 异常 观察 值 ,同时 在 统计 分 析 的 意义 下 做 
出 相应 的 修正 - 


* 是 否 接 受 (* 从 更 哲学 的 观点 上 来 说 " ) 那 些 看 起 来 似乎 是 异常 值 的 观测 值 
起 研 究 总 体 中 的 正常 现象 ,上 利用 合适 的 模型 进行 统计 分 析 . 

目前 还 没有 适当 的 统计 方法 来 处 理 .上 述 提 到 的 问题 , 全 是 统计 学 老 们 正在 从 
稳 键 推 断 、 检 出 异常 值 和 有 影响 观察 值 等 各 个 方向 进行 这 个 方面 的 工作 , 也 许 结 
合 由 交叉 数据 检验 所 得 到 的 信息 ,可 以 在 推 斯 数据 分 析 中 提供 - -个 统 -的 理论 . 
这 里 提供 一 个 例子 供 读 者 参考 . 

下 库 的 例子 表明 , 决定 省 略 或 不 省 略 一 个 异常 值 或 不 真实 的 观察 值 有 时 会 陷 
和 人 非常 左右 为 难 的 境地 .假设 从 期 望 位 为 y, MERN 的 总 体 中 得 到 N 个 观测 
值 , 其 样本 平均 值 为 x, 又 从 另 -个 期 望 值 为 = 标准 差 为 o 的 总 体 中 得 到 M 个 
值 , 其 样本 平均 值 为 ,如 果 忽 视 y 来 自 于 污染 的 观测 值 这 样 一 个 事实 , 则 p 可 
用 











Bo (Nx My) (N + M) 
Ahi. ido uc do, WRH OS, HM 219 N ACD, BOP <M 
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ERTER RA EHE REI. 含有 一 个 异常 值 的 总 体 其 均值 与 
要 比较 的 参数 标准 俩 差 相差 1 时 , 会 提高 对 p 的 估计 效果 .这 样 的 改进 在 小 样本 
的 情况 上 是 相当 可 观 的 . 


3.3 媒介 分 析 


AA: “KAA EP, 哪 一 个 更 重要 ?” 
学 生 ;“ 当 然 是 月 亮 了 ,因为 月 亮 是 在 最 需要 光亮 的 时 候 发 光 ,” 

在 作出 决策 时 ， 人 们 不 得 不 考虑 到 所 有 右 用 的 证 据 , 其 中 有 的 也 许 是 从 不 同 
渠道 所 获得 的 多 种 信息 , 有 的 也 洗 是 专家 们 的 意见 . 这 时 要 注意 的 是 以 下 几 个 
问题 : 

* 各 种 信息 可 信赖 的 程度 如 何 ? 

* 各 种 信息 与 要 凋 查 研究 课题 的 相关 程度 有 多 大 ? 

* AUREOS GEN. Sr 

* 从 各 种 渠道 获得 的 信息 可 能 不 完全 - - 致 时 ,我 们 应 如 何 综合 利用 这 些 信息 

来 得 到 一 个 结论 呢 ? 
以 上 这 些 问题 并 不 是 新 闻 题 ,但 在 一 次 调查 研究 中 通常 并 没有 强调 要 同时 考虑 这 
些 问题 .所 谓 媒介 分 析 , 其 目的 就 二 要 尝试 系统 地 来 研究 这 些 问 题 . 

对 任意 问题 相关 的 信息 的 主要 来 源 是 条 志 上 发 表 的 论文 或 是 来 自 特别 的 报 
告 -但 这 些 也 许 并 没有 代表 对 给 出 问题 的 所 有 的 研究 .例如 那些 没有 获得 成 功 结果 
的 研究 报告 是 不 会 发 表 的 .杂志 的 编辑 们 阻止 发 表 那 些 统计 显著 性 在 传统 检验 水 
ECR p < 0.05) 下 没有 结果 的 全 究 ,这 些 本 发 表 的 结果 终止 在 调查 者 们 的 文件 抽 
屠 是 ,而 不 能 用 于 评论 考察 .在 媒介 分 析 中 ,拒绝 不 利 结果 研究 中 所 提 刘 的 有 偏 性 
就 是 指 的 文件 抽 忆 问题 .已 经 有 ”` 些 方法 来 调整 从 而 最 小 化 这 样 的 有 偏 性 的 影响 . 

对 每 -- 条 信息 的 评价 能 够 使 我 们 决定 这 一 信息 在 归纳 中 所 占 的 比重 .但 是 ， 
综合 妃 纳 所 要 求 的 各 种 信息 必须 互相 没有 子 盾 . 最 终 要 选择 … 个 合适 的 方法 使 其 
能 业 ' 合 各 种 信息 ,同时 旺 示 出 最 后 结果 的 可 信赖 性 .所 有 这 些 查 求 我 们 慎重 和 用 
有 效 的 统计 方法 ,从 数据 的 精密 检查 到 数据 的 推断 分 析 , 或 许 也 需要 能 解决 问题 














ORERE ECX) Raw X 的 期 望 值 , V(X)( VAR(X) SOR AERE X 的 方差 . 
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的 哲学 论 理 ,就 像 前 面 引用 的 教师 和 学 生 的 对 话 一 样 . 


3.4 推断 数据 分 析 与 结束 语 


不 知道 问题 是 什么 而 要 回答 问题 ,当然 这 对 任何 人 来 说 都 是 不 寻常 


的 ,也 就 是 说 ,一 个 人 连 什么 病 都 不 懂 ， 却 要 去 开 药方 . 
RAE (J. Nehru) 


所 谓 推断 数据 分 析 ， 是 基 十 一 指定 的 随机 概率 模型 来 估计 未 知 参数 ,进行 相 
应 的 假 没 检验 ,预测 末 来 的 观测 值 ,以 及 作出 决策 等 的 统计 方法 .异型 的 选择 也 
许 到 决 了 我 们 要 从 数据 中 所 获得 的 特殊 信息 . 所 以 ,所 选择 的 模型 不 必要 求 能 解 
释 全 部 观测 所 得 的 数据 ， 而 是 仅 害 对 指定 的 问题 提供 有 效 的 回答 . 

要 回答 出 客户 提出 的 问题 而 进行 的 数据 分 析 并 不 是 统计 学 者 们 仅 有 的 工作 . 
为 了 了 解 给 定数 据 的 性 质 , 监 进行 更 广泛 的 数据 分 析 , 以 便 发 现 所 拥有 的 数据 能 
回答 哪些 问题 ,从 而 提出 新 问题 和 计划 进一步 的 调查 研究 . 

利用 不 同 的 随机 概率 模型 来 分 析 给 定 的 数据 并 日 检验 所 出 现 的 不 同 结果 , 这 
也 是 数据 分 析 的 “种 很 好 的 实践 .这 样 的 过 程 比 对 从 一 个 大 范围 的 随机 模型 族 中 
寻找 稳 键 的 推断 过 程 更 能 说 明 问题 . 应 该 探索 在 同一 弓 数 据 下 利用 不 同 的 模型 来 
回答 不 同 癌 是 的 可 能 性 . 

在 特定 模型 下 进行 分 析 时 ,有 可 能 组 示 出 数据 的 一 些 新 的 特征 ,也 许 会 要 求 对 
数据 分 析 最 初 的 计划 作出 一 些 调整 ,因而 推断 数据 分 析 应 该 是 具有 交互 作用 的 . 

评价 其 些 统计 过 程 的 模拟 研究 ,以 及 在 复杂 数据 结构 下 用 于 估计 参数 估计 量 
方差 的 自助 法 (beotstrap) 和 刀 切 法 (jack-knife)(Efron，1979) 均 在 很 大 程度 上 依赖 
于 计算 机 的 应 用 , 尽管 在 解释 这 些 数 据 分 析 的 结果 时 需要 阐 债 , 但 这 些 研究 已 经 
给 数据 分 析 增 添 了 新 的 上 内容. 

在 数据 分 析 中 通常 有 一 种 意见 认为 : 一 日 保 证 了 模型 的 有 效 性 则 存在 分 析 数 
据 的 最 优 方法 ， 如 基于 给 定 的 样本 , 利用 z 作为 正 态 分 布 均值 的 估计 量 , 或 是 作 
为 基于 无 放 回 抽样 基础 上 的 有 限 总 体 的 均值 的 倘 计 景 .后 ~… 种 情形 的 例子 可 考虑 
如 下 :随机 选取 种 植 的 三 株 树 为 样本 来 估计 一 行 果树 的 平均 产量 .假设 随机 抽取 的 
三 棵 树 的 产量 观测 值 为 x, n, ，zs:， 则 -- 个 可 用 的 估计 量 为 去 = 《zi + za + 
za)13. 然而 , 如 果 在 随机 抽取 样本 后 ,我 们 发 现 其 中 相 邻 的 两 棵 树 很 接近 其 所 对 
应 的 产量 的 值 ,如 为 zx 和 zz, 则 我 们 可 提出 总 体 平均 值 的 另 一 估计 量 全 = (y+ 
xz3)12, 这 里 ?= (zi+ zz)12. 可 以 看 到 , 在 至 少 选 择 两 棵 树 相 邻 的 情形 中 ,如 果 
相 邻 两 树 的 产 最 是 极 大 相关 的 ,， 则 样 木 的 人 的 方 益 小 二 x 的 方差 .应 该 探索 开发 
对 在 同 - -随机 概 举 模型 下 得 到 的 样 木 数据 的 个 同 结构 利用 不 同方 法 的 策略 . 
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下 耐 , 考察 所 谓 “ 加 尔 各 等 "问题 .假设 某 人 党 不 了 解 西 适 加 拉 省 的 加 尔 各 

和 其 余 城 市 和 乡镇 (以 此 为 计算 单位 ) 人 口 的 显著 差别 ,而 试图 hg 
单位 中 所 取 的 - -个 简单 样本 来 估计 贞 重 加 拉 省 的 总 人 口 . 这 种 情形 下 通常 所 用 的 
公式 为 : NI, N 表示 西亚 加 拉 和 省 所 含 单位 的 总 数 ,zx 为 n 个 随机 押 样 单位 的 样本 
平均 值 ,很 多 情 丧 下 NE 被 证 明 为 最 优 . 这 里 我 们 假设 加 尔 各 签 含 在 随机 样本 中 ， 
它 的 人 日 数 高 于 西 重 如 拉 省 任 -- 单 位 人 站 数 的 好 几 傍 .这 时 ,如 果 假 设 Nz 为 全 
省 人 口 的 佑 计 虹 将 会 是 一 个 大 灾难 , 特别 是 当 样 森 量 ”很 小 时 .如果 此 时 假设 
a, 为 样本 中 加 尔 各 徐 的 人 [1 数 ， 则 西 盐 加 拉 省 总 人 口 数 的 一 个 合理 的 估计 应 为 


N 1 
qi 10 tb x) 


我 们 所 做 的 是 :在 看 到 一 个 特殊 观测 位 集合 后 进行 分 层 . 

统计 学 者 常常 被 要 求 对 某 - -数据 集合 的 处 理 提供 合适 的 统计 方法 (或 者 是 软 
TERRE, 而 没有 机 会 对 这 些 数据 做 交 义 检验 . 这 时 我 们 应 该 向 对 方 说 明 : 统计 处 
理 不 是 简单 地 通过 电话 开 的 一 张 处 方 ,或 是 在 商店 柜台 买 的 东西 .所 收集 的 数据 必 
须 经 过 - - 定 的 诊断 检验 ,而且 如 果 数 据 基 有 某 些 特殊 的 特征 时 ,必须 要 在 处 理 过 
穆 中 考虑 ,在 这 样 的 统计 处 型 中 还 要 不 断 地 监视 整个 过 程 , 以 决定 是 否 需 要 对 原 
定 的 处 理 做 出 修改 . 

让 我 来 总 结 一 下 .统计 分 析 的 目的 是 ”从 观测 得 到 的 数据 中 提取 所 有 的 信息 ”. 
所 记录 的 数据 中 有 时 有 某 种 缺陷 , 如 存在 记录 误差 和 异常 值 ,有 时 其 至 可 能 是 盆 
造 的 , 一 个 统计 学 省 首先 应 做 的 尝试 足 详 细 考 察 或 交叉 检验 数据 ,以 便 发 现 吕 能 
有 的 缺陷 并 了 解数 据 的 特征 .下 一步 则 是 利用 先 验 信息 和 交叉 核实 技术 , 对 数据 
提出 -个 合适 的 随机 概率 模 击 . 基于 被 选择 的 异型 进行 数据 推断 分 析 , 包括 未 知 
参数 的 估计 , 假设 检验 , 对 林 来 观测 值 的 预报 以 及 做 出 决策 .建议 在 可 能 的 情形 
下 , 利用 多 个 不 同 的 模型 来 检验 数据 ， 比 起 对 可 能 利用 的 模 卉 使 用 稳 键 过 程 来 说 
可 以 获得 更 多 的 信息 .数据 分 析 也 - ` 定 会 对 提出 新 问题 和 计划 进一步 的 调查 研究 
提供 信息 . 

最 后 ,我 必须 强调 统计 学 家 种 实验 科学 家 需要 合作 研究 . 一 个 统计 学 家 可 以 帮 
勘 科 学 家 设计 有 效 的 实验 以 便 在 科学 家 提出 的 问题 .!- 获 得 最 多 信息 ,从 而 使 科学 
家 能 检测 自己 提出 的 假设 ,并 有 在 数据 产生 矛盾 迹象 时 进行 修改 .就 如 现代 实验 没 
计 之 父 费 歌 所 指出 的 : 


验 结 来 后 ,向 一 个 统计 学 家 咨询 的 常常 是 要 他 提出 一 个 后 续 的 检 
验 .他 或 许 能 指出 实验 失败 的 原因 . 
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第 4 章 ”加权 分 布 一 一 有 偏 数据 


科学 主要 是 要 建立 模型 ,并 不 是 试图 去 说 明 而 且 也 很 少 去 解释 什么 . 

这 里 所 说 的 模型 是 指 一 种 数学 结构 ,再 加 上 某 种 特定 语言 的 解释 杂 描 述 

所 观察 到 的 现象 .建立 这 样 一 种 数学 结构 的 理由 惟一 而 且 明 确 地 由 人 们 
所 期 待 的 它 的 机 能 来 决定 - 

35 EP S (von Neumann) 
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HHEN, EAA TA E h AR ER R RB A 28 EBUR, A 
要 确认 所 有 可 能 抽取 样本 的 集合 , 记 为 样本 空间 OO, E P 为 支配 样本 所 属 的 实际 
概率 分 布 的 概率 分 布 族 .推断 分 析 中 很 大 程度 依赖 于 P 的 选择 ,我 们 称 之 为 设 定 . 
错误 的 设 定 可 以 导致 错误 的 排 断 ,统计 术语 中 , 有 时 称 这 种 错误 为 第 3 种 错误 . 

设 定 的 问题 不 是 一 个 简单 的 问题 . 要 得 到 一 个 正确 的 设 定 ， ' 信 基本 因素 是 
要 对 如 何 得 到 数据 的 实际 过 程 有 一 个 详细 的 了 解 .采用 野外 观察 和 非 实 验 数据 时 
的 情形 更 为 复杂 ,此 时 自然 界 按 某 个 特定 的 随机 模型 产生 事件 ,事件 再 由 现场 观察 
者 观察 并 记录 下 来 .设计 一 个 抽样 调查 并 不 总 是 存在 一 个 合适 的 抽样 结构 来 保证 
所 发 生 的 事件 具有 指定 的 (通常 尾 相等 的 ) 机 会 成 为 样本 ,实际 上 ,自然 界 所 发 生 
的 所 有 事件 并 不 能 产后 抽样 结构 , 例如， 某 些 事件 不 可 能 被 观察 到 ,因而 在 记录 
中 缺失 .在 这 种 情形 下 就 产生 了 所 谓 的 截 必 样 本 、 截 断 样本 或 个 完全 样本 .或 者 ,一 
个 发 生 的 事件 仅 以 一 定 的 概率 能 被 观察 到 ,其 概率 大 小 依 束 于 事件 固有 的 性 质 ， 
如 它 的 显著 性 和 用 于 观察 的 过 程 . 其 结果 成 为 不 等 概率 抽样 . 或 者 事件 的 发 生 随 
观察 的 时 间或 过 程 随 机 地 变化 ,因而 所 记录 到 的 实际 上 是 修正 了 的 事件 .在 统计 
分 析 中 , 这 种 变化 或 损伤 必须 进行 适当 的 模型 化 .有 时 , 事件 来 自 丙 个 或 两 个 以 
上 具有 不 同 的 随机 结构 的 不 同 雄 道 ,这 些 混杂 在 一 起 进入 辣 - 记录 , 结果 成 为 污 
染 了 的 样本 . 所 有 这 些 情 形 如 果 不 进 行 适当 的 修正 ， 对 原始 事件 (将 要 发 生 ) 的 设 
定 与 查 明 得 到 的 事件 (观察 到 的 数据 ) 便 不 一 定 吻合 . 

费 鸣 (1934) 存 -~ 篇 经 典 论文 中 说 明了 依赖 数据 所 获得 的 方法 来 调整 设 定 的 必 
要 性 .本 书 作者 劳 在 他 的 著作 (1965,1973,1975,1977,1985) 中 发 展 了 费 点 的 基本 
思想 , 提出 了 一 种 称 为 加 权 分 布 的 理论 ,其 作为 一 种 调整 的 方法 可 以 应 用 于 很 多 
情形 .下 面 , 通过 对 - - 些 实例 的 讨论 来 叙述 - - 般 理 论 . 读 者 阅读 本 章 时 可 以 跳 过 某 
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4.2 截断 分 布 


某 些 事件 尽管 已 经 发 生 , 但 也 洗 有 不 可 观测 的 部 分 . 因而 所 观察 的 分 布 在 样 
本 空间 中 的 某 个 部 分 是 截断 的 . 例如， 如 果 我 们 调查 .一 只 昆 贝 产 卵 个 数 的 分 布 ， 
则 产 卵 个 数 为 零 的 事件 是 不 可 观测 的 . 另 一 个 例子 是 考虑 双亲 均 是 缺乏 色素 的 白 
化 病 患者 .而 他 们 子女 却 没有 因 缺 乏 色 素 而 患 白 化 病 这 样 的 家 庭 的 频数 .除非 父母 
有 患 白化 病 的 子女 ,一 般 没有 证 据说 明 双 亲 是 缺乏 色素 的 白化 疾患 者 .因此 , 双亲 
是 白化 病 患 者 没有 患 白化 病 子女 的 家 庭 已 经 与 正常 的 家 庭 汤 在 ~ 起 了 .这 样 , 双 
亲 患 白化 病 家 庭 而 子女 患 白 化 病人 数 为 零 的 事件 的 实际 频率 基 不 能 确定 的 . 

一 般 来 说 , 如 果 设 p(z,69) 为 随机 变量 X 的 概率 密度 函数 ,(X 为 连续 变量 
时 ,p(x,9) 表 为 概 府 密度 函数 ; X 为 离散 变量 时 ，p( xz,9) 表 为 概率 . )6 RIR 
MER., 随机 变量 X 在 样本 空间 人 的 特定 子 空间 TC0 内 截断 , 此 时 ,截断 随机 
变量 XT 的 概率 密度 函数 为 

p'(2,0) = whe Dem (4.1) 
这 时 ,如 果 ET, w(x,T)—1; x EP w(x,T)=0,u(T, 0) - ELw(X, T)]. 
公式 (4.1) 表 示 经 一 个 适当 的 函数 加 权 后 的 原始 概率 密度 函数 ,这 是 加 权 概 率 分 
布 的 一 个 简单 例子 .下 一 节 将 给 出 加 权 概 率 分 布 的 一 般 定义 . 

假设 在 试验 次 数 为 = 成功 事件 的 概率 为 x 的 二 项 分 布 抽样 中 , 事件 为 零 是 
不 可 观测 的 . 记 RT 表示 截断 二 项 随机 变量 TB(truncated binomial), Jj 























1 1- or 
P(R" = r) = AR pa DE rcd (4.2) 
对 这 样 的 分 布 , 有 
EQU) = Doe ECR n) = (4.3) 


(1 -x» -ü =x)" 
《4.3) 中 的 值 比 起 完全 二 项 分 布 情形 下 分 别 对 应 的 nx 和 来 说 要 大 一 
下 面 的 数据 来 自 欧 洲 某 一 教授 的 私人 电话 德 ， Mp 
的 兄弟 姐妹 的 人 数 (括号 中 第 一 个 数 是 包括 女 学 生 本 人 在 内 的 姐妹 的 人 数 , 第 一 
个 数 是 她 兄弟 的 人 数 )， 


(1,0), (1,0), (1,1), (DB 0,0, (1,1), (1,1), (1,1), G0 
(1,1), (2,0), (2,0), (2,0), (2,1), (2,1), Q.D. (2,1), (1,2), (1,2) 
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(3,0), (3,0), (3,1), 0,3). 0,3), (4,0), (4,1), 0,4) (4.4) 


WO UTR ABE SD Ee, PULO RE HOE RS 
BROS A Uo (Sh A EE Ah BT) Ao 个 
子女 ( 即 被 观察 的 家 庭 中 子女 总 人 数 为 ”) 的 家 庭 的 观测 频数 , 并 设 女 孩 人 数 的 概 
率 为 x=0.5, 则 女孩 数 r 来 自 截 断 一 项 分 布 假设 下 的 期 望 值 为 











MAGOEGO (4.5) 
把 (4.4) 的 数据 代 人 公式 (4.3) 和 (4.5)， 得 到 如 下 结果 中 : 
子女 数 i 观测 值 LET 
dk E mE B 46 
HK un i 30 ~ 31 











上 述 结果 显示 : 在 截断 二 项 分 布 的 假设 下 观测 数据 与 对 应 的 期 望 值 的 结果 非常 接 
IEEE. 在 类 似 的 情形 下 ,利用 下 列 数 据 却 产 生 了 不 辐 的 结果 .下面 这 些 数据 是 
如 尔 各 答 一 个 男 学 咎 所 认识 的 10 个 女孩 子 家 庭 中 的 子女 人 数 , 排列 法 同上 . 


Q.D,0,0,G.0,0,0,,0,0,0,0,0,0,0,(0,D,0,D.— (4.6) 


ERR I, KARO A RI WA WE 14. 6( 由 公式 (4.3) 和 
(4.5)), TENUES 17. PR ii 08i — AE (4. 6) 不 合适 . 看 起 来 
欧 淹 的 教授 和 加 尔 各 答 的 男 学 生 所 结识 的 女孩 的 结构 是 不 同 的 . 

要 注意 的 十, 如果 我 们 在 某 一 城市 抽取 一 些 家 庭 作 为 样本 ,调查 每 一 个 家 庭 
中 的 兄弟 姐妹 人 数 ( 即 子女 人 数 ), 则 预期 女孩 的 人 数 来 自 完全 二 项 分 布 , 如 果 从 
获得 的 数据 中 略 去 那些 没有 女 扩 的 家 庭 ,。 则 数据 就 来 自 截断 二 项 分 布 . 欧洲 教授 
的 数据 是 从 至 少 有 一 个 女孩 的 家 庭 的 集合 中 抽取 的 , 下 一 季 我 们 将 看 到 出 随意 磁 
到 的 男孩 或 女孩 调查 他 们 的 兄弟 姐妹 人 数 是 来 自 不 同 的 分 布 的 . 上 面 提 到 的 加 尔 
各 管 的 男 学 牛 的 情形 人 约 是 属于 这 种 类 型 . 














中 对 (4,4) 数 据 来 说 ,有 如 下 结果 : 








n 1 2 3 4 5 
E(rln) 1 4/3 12/7 3215 80/31 
fin) 2 12 7 5 2 





s 
Fit, BAREIS G0 E Cr In) = 45 15946. — TE 
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4.3 Jm AR 4 f 


上 一 告 中 , 我 们 已经 考虑 了 某 些 事件 不 可 观测 的 情形 .但 更 RORE 
BUR BAIR 下 某 一 事 作 的 发 生 ( 或 是 已 经 包含 在 样本 中 ). 设 X 为 随机 变 
He, 其 密度 函数 记 为 p( ,8),0 为 参数 . 设 当 X= 工 发生 时 所 记录 下 来 的 概率 为 
mw(zya)， 其 取决 于 观测 值 x+ 也 许 同时 还 皮 决 半 ARMER a. 这样 得 到 的 随机 
ERA X, CHERERE REO 








pr (x0,0) = Sepp os D an 
尽管 在 导出 公式 (4.7) 时 ,我 们 选择 wla, ERWE wlr o) 1, 但 M 
说 来 ,在 [w(x sa) PAE BATTAL ERE DLE wle ,a) 定 义 (4.7) .这样 得 
到 的 密度 西数 称 为 p(x ,0) 的 加权 形式 , 记 为 p Ge 0) .特别 是 当 /(z) 为 的 
MAERU, MUM: 














DICES EREDA (4.8) 


称 为 是 X 的 容量 有 偏 分 布 (size biased distribution). 当 X 为 一 维 变量 且 非 负 时 ， 
由 劳 (1965) 介 绍 的 加 权 分 布 





p°(2,8) = ED, (4.9) 


已 经 用 于 很 多 实际 问题 (参见 Rao(1985)). 24 a = 1 时, 称 为 长 度 ( 容 量 ) 有 偏 分 布 . 
例如 , 如果 X 服从 对 数 级 数 分 布 





P(X = D^ Ay r1 (4.10) 
则 长 度 有 偏 变量 的 分 布 为 
PU*-D--0687,r512,7 (4.11) 


这 表明 X" — 1 HAA SL AT SY fi. CES RC BR RT J Lf 43 NEA OL AR 
好 的 拟 合 性 (Feller，1968) .但 是 ,如 果 有 关 家 庭 人 数 的 信息 是 从 在 校 学 牛 中 获得 
的 , 则 观测 值 可 能 服从 容量 有 偏 分 布 .这 种 情形 下 ,几何 分 布 对 家 庭 人 数 观测 值 的 
优良 拟 合 ， 实 你 上 是 指 其 本 身 的 基础 分 布 为 一 对 数 级 数 分 布 . 

如 劳 (1965,1985) 指 出 的 那样 ,在 很 多 离散 分 布 的 情形 中 ,容量 有 偏 分 布 的 形 
式 与 其 原始 分 布 的 堪 式 是 属于 同一 分 布 族 的 . 对 数 级 数 分 布 是 一 个 例外 ， 
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自 劳 (1965) 公 式 化 加 权 分 布 的 概念 以 来 , 已 经 出 现 了 大 量 的 有 关 文 献 . 帕 梯 
(Patil, 1984) 的 文章 中 列举 了 大 量 的 参考 文献 ， 特别 是 对 加 权 分 布 研究 的 早期 贡 
献 可 参考 Patil 和 Rao 1977, 1978), Patil 和 Ord(1976).Raol 1985 ) 综 合 报告 了 迄 
今 为 止 的 研究 工作 和 某 些 新 的 成 果 . 


4.4 随机 比率 抽样 法 (p.p.s. 抽 样 法 ) 


应 用 加 权 分 布 的 一 个 例子 吕 参 儿 人 们 利用 不 等 概率 抽样 法 或 概 举 比 例 p.p. s. 
抽样 法 (probability proportional to size) 进 行 的 抽样 调查 ，- 艇 在 含有 两 个 随机 变量 
XGUY 的 样本 抽样 中 ，(X, Y) 的 联合 概率 密度 函数 为 plr, y0), DAR BAR 
wl y MS y HR, MX, Y) 的 加 权 联 合 概率 密度 函数 为 





Playa) = ODE Cus (4.12) 


FERRIER, h RARER R Ee 4. 12 ) 的 随机 变量 (X*, Y* ) 的 观测 值 来 推断 
参数 9. 
HBBE, X 的 边缘 分 布 为 


wha 8) p(x,0@) 


p (2,6) = w(X,8) (4.13) 
它 是 p(x ,6) 的 加 权 形 式 , BURTON 
wí(x.8)- [oc | x,0)w(y)dy (4.14) 


给 定 一 个 大 小 为 x 、 来 自分 布 (4.12) 的 样本 
Cars pi), Gv) (4.15) 


此 时 感 兴趣 的 一 个 参数 , 即 关于 原始 概率 密度 函数 p(x,y,9) 的 均值 ECX) 的 一 
个 估计 量 为 


Elw 1y Prey (4.16) 
这 是 E(X) 的 -个 无 偏 估计 量 .而 估计 量 





Le 
aot (4.17) 


A ECX*) B — A GARA TEE BE (X ) 为 (4.13) 式 中 加 权 概 率 密 度 函 数 
Pp”(z,9) 的 均值 . 
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4.5 加 权 二 项 分 布 : 经 验 定理 


如 果 在 任意 时 间 和 任意 地 点 在 一 个 用 级 或 是 任 一 个 集合 中 调查 其 中 每 - -男性 
所 拥有 的 兄弟 人 数 (包括 被 调查 的 男性 本 人 ) 和 姐妹 人 数 , 则 出 现下 面 的 问题 . 如 
SRB, S 分 别 代表 被 调查 男性 所 拥有 的 全 部 兄弟 人 数 和 姐妹 人 数 , 问 BB +S) 
的 渐进 值 为 多 大 ? 显然 我 们 是 从 罕 少 有 -… 个 男孩 的 具有 截断 分 布 的 家 庭 中 抽取 的 
样本 , 因而 B/(B + S) 的 值 应 大 于 1/2, 但 到 底 大 多 少 呢 ? 十 分 惊奇 的 是 ,如果 补 
调查 的 男性 人 数 大 不 是 很 小 时 , 我 们 可 以 正确 预测 B 和 S 的 相对 大 小 , 以 及 比率 
BB+ S) 的 值 .这 可 表 为 如 于 的 经 验 定理 . 

经 验 定理 1 We 为 在 任意 地 点 任意 时 间 任 一 集合 中 观测 到 的 男性 样本 人 
数 ，B 为 其 全 部 兄弟 人 数 (包括 个 男性 在 内 )，S 为 姐妹 总 人 数 , 则 可 做 如 下 蔬 
LE 

G) BiEXTS. 

(i) B-k 近似 等 于 S. 

Gi) BI(B+ 8) 大 于 1/2, WEF seg os. 

Gv) (B- IG +S- k) 接近 于 1/2. 

如 果 数 据 是 从 一 个 女性 集合 中 收集 到 的 , 则 B 和 SS RED. 

考虑 -个 有 个 子女 的 家 庭 .这 个 家 庭 拥 有 的 男孩 的 人 数 假设 服从 = 1/2， 
指标 为 ”的 二 项 分 布 , 则 有 个 男孩 的 概率 为 








! -n = 
plr) = UG o? )rc0,52,;7 (4.18) 


这 里 , 因 我 们 考虑 的 是 至 少 有 一 个 男孩 的 事件 , 则 适合 的 分 布 应 是 截断 分 布 .一 
个 可 能 的 结果 是 截断 二 项 分 布 (TB) : 





n! 


- 1 
PO) = Fa eT" 


r= 1,2,. (4.19) 


另 一 个 可 能 是 容量 有 偏 分 布 (WB) (译注: 实际 上 是 加 权 二 项 分 布 , 故 原 书 也 使 用 
略 写 符号 WB) 


ror- 





n-1 1v 
5 r= 1,2, (4.20) 
了 一 | ( 2 ” 

劳 (1977) 指 出 ， 对 各 种 观测 数据 来 说 , ARA. 20) E4. 19) ER EFE 
(中 国 ) ,马尼拉 (菲律宾 ) 和 备 买 (印度 )3 个 城市 的 大 学 中 男性 大 学 生 分 别 调查 得 
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来 的 数据 ， 表 4.1 给 出 了 不 同人 数 的 家 庭 中 兄弟 人 数 的 频率 分 布 的 观测 数据 ， 以 
太 分 别 在 截断 二 项 分 布 TB(4.19) 和 容量 有 偏 分 布 WHB(4.20) 假 设 下 的 期 望 值 . 
从 表 4.1 中 可 知 ,WB( 加 权 二 项 分 布 ) 比 TB( 截 断 二 项 分 布 ) 的 拟 合 性 更 好 ， 
JE S BAR e 个 兄弟 人 数 的 家 庭 是 按 r 进行 概 举 比 率 抽样 的 
Ral 不 同人 数 家 庭 中 男孩 的 观测 频数 以 及 候 设 TB 和 WB FEMA 
CHO DEW, SEN, 孟买 的 男性 大 学 生 》 
nl | n=2 | 3 
me O Arf wu 
8 | ws mma] TB | ws mis vs | wn 















































































































1 8 |] 6 6 M | a7 | 258 | 2 | 24 | n7 
03 I 9 fina | ans | a 2] 2 
3 : | mE user] us 

和 el 4 6 ao | 43.0 | 47 | 47.0 | 47.9 | 

EM ni] s3, 5 es 25) t | aol os 

2 10 we) ass| s | 2s] wo; 4 48. 34 

i 3 PO E a 2 15.7 15 12.9 “15.0 4 esl 6.3 

4 | 7 | 28] s3] w es | wo] 9 ss | 63 

5 | 2| nr] as 2 TEC 

6 : o 0.3 0.6 

m | 2 | eol go) d 400 | 40.0 ^F» | oo] mas 

















如 接 受 加 权 二 项 分 布 ( 即 容 晤 有 偏 分 布 )(4.20) 的 假 没 , SE B TA 











: NEN AY ntl 
E(rind= Me (s) $ (4.21) 
Ser D=% (4.22) 


ABE Crp, nsnm. S- T-B, Bar, tee 
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een DH SER IA, 有 


EB -D-MEG-D-X ";i-"gt-EG) a.m 





E08)= £35, e(E)- e(g E.)- 1: (4.24) 


+ pte 

2 B+S 2 20B +S) 

如 果 在 (4.23) 和 (4.24) 中 除去 期 望 值 的 符号 ,就 得 到 经 验 定理 PERORAL 
等 式 . 





























过 去 20 年 浊 , 我 在 世界 各 地 对 学 牛 和 教师 做 讲座 时 , 在 听众 中 收集 了 他 们 家 
庭 中 的 兄弟 姐妹 人 数 , 所 得 的 结果 概括 在 表 4.2 一 4.5 中 . 可 以 看 到 由 经 答 定 埋 1 
所 做 的 项 测 ,， 在 加 权 二 项 分 布 的 假设 下 对 各 种 情形 均 足 吻合 的 . 作为 加 权 -项 分 
布 的 进一步 检验 ,计算 了 各 种 场合 中 统计 量 (4.2S) 的 值 .统计 量 (4.25) 渐 进 服从 日 
由 度 为 1 的 卡 方 分 布 : 
好 一 AlB -K LT kya)" (4.25) 
R42 男性 (学 生 ) 回 答 者 的 数据 
T 7 : 
地 点 和 时 间 ( 年 ) + | 05 | 05 | afs msa] 7 
i — - — - 
正 加 罗 尔 (印度 ,1975)! — 55 180 127 0.586 | 0.496 0.02 
德甲 (印度 , 1975) 29 2 | 6 0. 582 , 0. 490 : 0.07 
JRARAS AE CERE 1963) | — 104 44 | 312 0.50 | 0.48 | 0.04 
威 尔 特 (印度 ,1969) s | om 88 0.583 | 0.491 0.09 
阿美 普 巴 (印度 ,1975) 29 84 49 0.632 0.523 0.35 
- - - - | io 
梯 露 帕 提 {印度 ,1975) | 592 1902 į 1274 0. 599 0.484 . 0.50 
波 那 (印度 ,1975) 47 125 65 | 0.658 0.545 1.18 
海 得 拉巴 (印度 ,1975) 25 72 53 i 9.576 0.470 0.36 
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BER 
T 
| 
r y . B i BR 
好 点 和 时间 ( 秆 》 k B s Bis Bs # 
BS (GARY ,1975) 21 65 5 0. 500 0.19 
HERE OF BI 1975) 11 45 0.515 0.06 
东京 CH 本 .1975) 50 90 34 0.540 0.49 
TIS ORBE 1982) 38 132 87 0.519 0.27 
上 海 5 中 国 ,1982) 74 193 132 0.474 9.67 
于 伦 布 (美国 ,1975) 29 65 52 0.409 2.91 
BOREAS i j 
(美国 ,1976) 63 152 90 0 628 0.497 | 0.01 
All 1206 ， 354 | 2501 | 
3s . 0.600 , 0.503 0.14 
PR CAUEISEG 五 -包括 阅 查 者 本 人 在 内 的 兄弟 人 数 ,S 一 姓 妹 人 数 .容量 有 偏 分 布 假设 


Bor 的 估计 值 = (B 一 (B+ S- E). 


Mai BUTE KP SET ARAB AN, 验证 去 明 加 权 一 项 分 布 是 适宜 的 . 
[实际 了 由 于 这 些 卡 方 值 大 小 , 有 必要 进一步 考察 疯 测 数据 的 结 绝 , ] 
表 4.3 SEH DSS 





地 点 和 时 间 ( 年 ) k B s i | zizi r 












































B+S |B+S-& 
| 16 » | 4 0.565 | 0.464 0.36 
(4 ; 09 0.579 0. 485 0.18 
nu 281 0.588 0.500 0.00 
HURENSONNOT.083)| 14 | 19 35 0.576 | 0525 | 0.10 
“TECH, 1982) 7 | 27 | B8 | ss | 0.662 | 0.500 0.00 





注释 1h (4.24), 给 定 平均 家 庭 了 女人 数 f = (B ESO E 时 ,对 应 于 备 个 
/人 入 , 比 率 Bi(B + S) 的 期 望 值 如 下 : 
fe 1 2 3 4 5 6 
E'BAB+S)]: 1 0.75 0.67 0.625 0.6 0.58 
表 4.4 中 教授 同 答 的 数据 略 有 不 同 ,从 各 地 得 到 的 估计 值 均 大 于 1/2, RT 
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BEA X RANE TAE RR IN TAR RB EE Ar ST. AR 8 
性 教授 出 身 的 家 庭 中 儿子 的 人 数 近 大 于 女儿 的 人 数 . 


表 4.4 男性 (教授 ) 回 答 者 的 数据 










































地 点 和 时 间 ( 征 ) i | 8 ,Ss | ats 
LIONE 28 | E q03 c 06m || 
TEES, 1975) 18 | a n B 9.660 
didi QE, 11975) i [om d NE ` ` n Ud 0.746 | 
Fe CE E, 1981) | 6 ] ge r+ m 0.687 

提 ( 印 度 ,1975) J ^s -j+ UD | 132 | 0.566 
(EWR, 1982) 24 95 56  , 0.629 
ENEG, m O| o: 4 s qo 3 | v6 
和 | 239 (d 664 ' 369 BE 
m 00d BE 0.642. 














这 些 数 宁 显示, 在 给 定 家 庭 的 平 册 人 数 不 超过 6 的 情形 下 ,对 任意 集合 中 的 
务必 调 售 其 兄弟 和 姐妹 人 数 时 . 可 对 兄弟 总 人 数 B 和 姐妹 总 大 数 S 做 出 以 下 预 
测 : 

G) B WKFS. 

Gi) H 1/2 HEE, BB+ SS) 的 值 殉 接近 于 0.6 RAEE] 2/3. 

GD) BAB+S-A) 接 近 于 12, 这 里 为 回答 问题 的 男性 人 数 . 

使 人 惊奇 的 是 ,其 主 在 “个 集合 中 男性 人 数 k 较 小 时 这些 项 测 依然 成 立 . 
E -个 很 好 的 课堂 练习 是 月 ,也 可 在 任 一 集合 中 上 难 证 . 可 以 事先 做 出 这 些 预 
测 ， 然 后 出 从 男性 (或 女性 ) 成 员 中 收集 所 得 的 数据 来 验证 . ] 

注释 2 C #4=1,2,… 加 权 二 项 分 布 情形 不 时 , 表 4.5 给 出 3 个 事件 B, 
BS, B<S 的 概率 . 

Ras BE B>S, B=S, B<S 的 概率 




















2/83 4 5 56 7 8 9 10 
_ Bes | 1 i i E g i A 各 3 E i 
(BUS jo E 09 $ 0 3 0 m o $ 

Bes | 9— 0 Yd s e Do d D» xo dB 
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从 表 4.5 可 知 , 对 每 一 个 n, 事件 B» S 的 概率 已 (日 > S) 远大 于 事件 B< 
S WS PCB S) dls: 

在 任意 给 定 的 听众 总 休 中 ，5,( 表 男性 所 属 家 庭 中 B> S) 比 5,( 表 男性 所 属 
家 庭 中 B< 5) 的 比 秆 依赖 于 家 庭 人 数 的 分 布 ,有 是 能 增 和 人. 现 给 出 另 一 个 经 验 定 
理 . 

经 验 定理 2 5 dtd, 的 比值 近似 地 等 于 下 列 (4.26) 和 (4.27) 右 边 表 达 式 的 
比值 ; 





3 11 
EU = p+ Bist lees +t) (4.26) 


EQ) = fet ght (4.27) 


BU p, AME n 个 子女 的 家 庭 的 个 数 . 
EPIKE RRD EN DE Jr OT ARP DOSE 6, : b, 的 值 很 可 能 比 4:1 EK, MA 
方 听众 的 比值 大 于 2:1, PES ACE 1:1.[ 这 个 现象 是 可 以 预测 的 , FP EGRE 
FREE AE APR B>S 或 者 是 类 型 B< S 的 家 庭 所 得 的 分 类 数据 可 
以 验证 这 个 现象 . 这 也 是 一 个 很 好 的 课堂 练习 其 目 , 也 可 在 任 一 集合 中 验证 . ] 
注释 3 设 家 庭 人 数 N— ,玉女 中 兄弟 数 为 B = o 时 的 概率 为 p(5,n), 并 
时 假设 选择 这 样 -个 家 庭 的 慨 率 是 与 成 比率 的 , 则 有 








— —— n 
ios Ey pon (4.29) 


25 p(n) RMIT, A 
Ca) = ER, BX CEN) = WE(N) (4.30) 


肉 而， 由 分 布 (4.28) 或 (4.29) ,AN 的 观测 值 m ,…，,m 的 调和 平均 值 





k 
PE 


为 原始 分 布 期 望 值 ECN) 的 一 个 估计 值 . 如 果 p( 4) 的 形式 是 给 定 的 , 则 利用 概 
率 分 布 冰 数 (4.29), 可 写 出 样本 i.n ,ns 的 似 然 函数 ,由 利用 极 大 似 然 
木 知 参数 、 





(4.31) 
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4.6 MA, ZEAK H EIE 


Wii Smari, 1963, 1964) A E (Sprott, 1964) 利 用 加 拿 大 安大略 省 
的 3 个 酒精 中 毒 治 疗 所 人 院 治疗 的 242 个 醒酒 者 的 家 庭 人 数 和 出 生 炭 译 的 数据 ， 
检验 了 加 拿 大 人 家 诗 中 醒酒 者 的 发 十 率 等 右 十 假设 . 这 里 所 用 的 抽样 方法 是 上 一 
节 所 讨论 的 类 型 . 

IRS abs 如 有 果 家 庭 人 口 多 ， 则 醒酒 中 毒 首 人 数 大 于 期 望 值 .这 里 给 
出 醒酒 中 毒 者 人 数 与 期望值 相等 的 地 假设 是 由 家 庭 人 数 的 观测 值 服从 加权 分 布 

Ge). nde (4.32) 

的 意义 上 得 刘 的 ,这 里 p(n), =1,2,… 为 一 般 总 体 中 家 庭 人 数 的 分 布 ,斯 包 特 
利 斯 普 柔 特 在 他 们 的 钱 究 分 析 中 利用 安大略 省 1931 年 人 中 统 计 调 查 中 家 庭 人 数 
的 分 布 作为 p(w). 这 时 容易 检验 他 们 所 观测 的 家 庭 人 数 的 分 布 是 否 与 所 预期 的 
JR CA 32)- BE. 

要 注意 的 是 , AE Fe He CRUS A 2X JE BITS 3 B n 6 GP REDUCE 
本 并 调查 他 们 的 家 庭 人 数 , 则 分 布 (4.32) 是 合适 的 . 但 是 , 如 像 斯 马 特 和 斯 普 柔 
特 所 收 的 那样 , 调查 如 果 仅 限于 消 精 中 毒 治疗 所 人 院 治 疗 的 个 体 , 那 就 不 十 分 消 
楚 (4.32) 是 各 仍然 成 立 ,. 上 述 情 形 可 以 通过 下 面 和 的 过 程 来 验 让 .在 他 们 的 原 仍 设 
下 , 即 一 个 家 庭 的 酌 消 中 毒 者 的 人 数 服从 二 项 分 布 ( 允 如 独立 试验 中 失败 的 次 数 )， 
进 - - 步 骨 假设 每 -个 醒酒 中 毒 痢 含有 同样 的 独立 的 机 会 人 院 治 疗 . 

Bor A PAR BUNT PE BL, 并 假设 家 庭 中 的 “个 成 员 变 成 酌 酒 
中 王者 的 概率 与 家 庭 二 一 -个 其 他 成 员 是 个 是 酌 油 中 毒 者 无 关 . 进一步 假设 一 般 总 
体 中 家 庭 人 数 的 分 布 (无 论 这 个 家 庭 是 否 有 醒 消 中 毒 者 ) 为 p(n), n=1,2,…. 则 
REA BOY n AA ABO r 的 概率 为 











p(n) 


. WE Sr = Open; a = 12 (4.33) 
ry 
RE $51- r. rh(4.33), AB -AREENA — IS UB EA 
RUE 

i ERGO dne (4.34) 
ROR BRAT E RHE EE — EE CER He ES > A a — IH Bn dt ES E et t HY A 
7c, idi EBENE an (4.34) FAA RAR, 可 检验 人 口 多 的 家 庭 中 醒酒 中 


4.6 BUB, 家庭 人 数 与 出 竺 顺序 75 





毒 者 人 数 过 度 的 原 假 设 .但 足 ,如 果 从 呆 个 酒精 中 毒 治 疗 所 收 窜 的 醒酒 者 中 提取 = 
Ar, 则 下 面 的 (x ,r) 的 吉 权 分 布 更 合适 ， 
Pla, r) - Pin) AG Sy ey (4.35) 
fi RATE AERE YT REAR n AHP AA IRIURE PE RAK 的 信息 , 则 串 化 较 
《rr) 的 联合 观测 频数 和 由 模型 (4.35) 所 得 的 期 望 值 . 
由 (4.35), n 的 边缘 分 布 为 


T. a-12,-— (4.36) 





Ne THE AUG RAY RE SORA LEA, eh PITIA. 04 E 
少 有 emi oem te AS aia Pa pl), 08 GET 1 时 化 简 为 


(4.36). 换 音 之 ， 旭 果 一 个 个 体 变 为 柄 河中 毒 者 的 概率 很 小 , 则 被 调查 的 家 庭 人 
数 的 分 布 接近 于 -… 般 总 体 中 全 少 有 一 个 醒酒 者 的 家 庭 人 数 的 分 布 . 如果 $ 不 接近 
1， 此 结论 不 真实 . 

斯 马 特 和 斯 普 季 特 发 现 ， 如 果 观 济 值 分 布 的 频数 是 郑 尾 的 则 不 适合 (4. 36) 
式 .他 们 世 言 人 数 殉 多 的 家 庭 产 生 柄 酒 中 玫 者 的 频率 高 于 平均 值 .这 个 结论 目 确 
吗 ? 我 们 知道 , 加 权 分 布 (4.36) 是 存 两 个 假设 下 导出 米 的 . ' 个 假设 是 : -- 般 总 体 
中 ,来 月 至 少 有 有 个 柄 酒 中毒 者 的 家 庭 子 集合 中 的 家 庭 人 数 的 分 布 服从 (4.34)， 
这 旦 最 时 由 斯 己 特 提出 的 零 假 设 推出 的 . 另 个 假设 是 : 数据 出 样 方 尖 等 价 于 按 
一 个 家 庭 中 酮 酒 中 毒 者 人 数 的 概率 比 进行 的 p. p.s. 手 样 -如 果 第 二 个 假设 是 正确 
的 ,那么 拒绝 (4.36) 语 意味 善 拒绝 这 两 个 假 没 中 的 第 一 个 .一 般 对 这 样 的 假定 并 无 
前 的 根据 ,也 缺乏 客观 的 验证 ,所 以 在 采用 斯 马 特 的 结论 时 归 慎 重 . 

斯 马 特 的 另 一 个 假设 是 ,后 出 生 的 子女 比 先 出 生 的 了 女 更 符 易 变 成 本 河中 毒 
者 -斯 马 特 在 这 里 所 用 到 的 方法 会 使 统计 学 家 们 多 少 感 天 有 些 迷 惑 , 在 批评 斯 己 特 
的 方法 时 ,斯 普 柔 特 做 了 些 评论 .下 向 由 模型 (4.35) 玉 回顾 ` 下 斯 己 特 的 分 析 过 
PE. 如果 假设 出 生 虎 序 与 成 为 酮 酒 中 海 者 无 关 , 而 且 一 个 酮 酒 中 毒 省 就 住 于 某 - 治 
疗 所 治疗 的 概率 独立 出生 顺序 ， 巾 一 个 观 洲 到 的 柄 酒 中毒 者 出 生 于 一 个 含有 r 
Arr AE REA a 个 了 女 的 家 庭 ,下 这 个 被 观察 者 的 出 生 硕 序 为 ;过 的 概率 为 
(4.35) 式 除 以 n, BI 

















n 











roln) |n! 
nEn) WTP, ss hye yng r= ipenn = 1,2, (4.37) 
rà 





Pb r RA, 则 可 得 到 关上 家 庭 人 数 n BIUEJDUY s 即 (n ,s) 的 边缘 概率 分 布 





76 第 4 mx cade 





Brice = 1,2, 7 (4.38) 


RAAEN TARE HERE, BAY p(n) = 1,2,… 为 一 般 总 体 中 家 庭 人 
数 的 分 布 .斯 马 特 给 出 了 (2 ,5) 的 二 元 观测 数列 ， 因 为 p(n) 是 已 知 的 , 我 们 能 够 
计算 (ass) 的 期 望 值 并 与 观测 值 进行 比较 .但 是 ,斯 马 特 不 是 这 样 做 的 . 

由 公式 (4.38), 出 生 昼 序 的 边缘 分 布 为 


P(S = 5) = Evy NA, $12, (4.39) 


在 斯 马 特 (1963) 肯 2 AO ADIT, iio Ee EE BEEG AS HI] MO OM EL Sot GR RT 
(4.39) 下 的 期 望 值 , 其 中 p (i) 由 观察 数据 利用 模型 (4, 32) (i. 

一 个 较 好 的 方法 如 下 : 由 (4.38) 可 人 针 , 在 给 定 家 庭 人 数 时 ,出 牛 顺序 频数 的 
期 望 值 计 算 结 果 与 斯 马 特 (1963) 胡 上 中 计算 的 结果 相同 .这 时 ,为 比较 每 一 家 庭 
人 数 的 期 银 信 与 观测 频数 的 各 长 方 值 将 提供 坑 要 检验 的 右 关 彼 设 的 一 切 信 息 .这 
一 过 程 与 任何 p(x) 的 信息 是 无 关 的 .但 不 清楚 的 是 , 斯 马 特 提出 的 这 种 类 型 的 假 
设 是 否 能 够 在 没有 进步 的 有 关 一 油 中 查 者 的 信息 ,诸如 年 龄 和 性 别 ,而 只 在 现 有 
的 数据 基础 上 进行 检验 . 

表 4.6 复 制 了 斯 马 特 (1963) 表 1 小 有 关 家 庭 人 数 为 4 以 下 , 旦 出 生 硕 序 也 为 
4 以 下 的 部 分 . 可 以 看 到 当家 庭 人 数 为 2 和 3 时 ， 观 测 频数 与 假设 是 矛盾 的 ; 而 家 
庭 人 数 在 3 以 上 时 , 出 汪 顺 序 完 全 没有 影响 (参见 斯 马 特 表 1 或 表 4.6) .作者 把 汇 
兹 堡 大 学 两 个 系 的 教员 中 所 收集 到 的 类 似 的 出 生 顺 序 与 家 庭 人 数 的 数据 ( 表 4.7) 
与 斯 马 特 的 结果 作 了 比较 ,得 到 有 趣 的 结果 .大 多 数 的 教员 都 在 家 庭 中 排行 靠 前 ， 
显示 了 要 成 为 教授 是 家 中 排行 从 前 者 的 蔡 信 .可 以 预期 的 其 ,在 我 们 所 考虑 的 数 
据 中 ,即使 无 视 出 生 蚌 序 与 某 个 特别 的 属性 ,特别 是 与 年 龄 有 关 的 聊 含 关系 , 在 家 
庭 中 排行 虞 前 的 人 也 是 占 优势 的 . (这 可 以 作为 男 一 个 课堂 练习 . 去 任意 一 个 研究 
室 调 查 多 少 人 是 长 子 /长 女 ,第 二 出 生 的 ,……: 你 会 注意 到 先 出 生 的 人 所 占 的 优 
势 .) 














表 4.6 栅 酒 中 审 者 出 生 顺 序 积 家 庭 人 数 的 分 布 (摘自 斯 马 特 (1963) 表 1) 
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1 2 21 2 16 17 B3 n 1175 
2 10 16 14 13.3 10 — 1075 
3 9 13.3 Bots 
4 13 15 
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表 4.7 匹兹堡 大 学 教员 的 出 生 上 顺序 和 家 庭 人 数 n <a 的 分 布 
n=l n=? nc3. a 

7 14 9 

6 4 
2 








OMI 
cone. 





4.7 等 待 时 间 悖 论 


帕 梯 (Patil，1984) 提 到 了 摩洛哥 同 立 统计 经 济 应 用 研究 所 1966 年 进行 的 一 项 人 研 
究 , 这 个 研究 的 日 的 是 估计 观光 旅游 者 平均 去 留 的 时 间 . 这 里 进 行 了 两 种 调查 ，- -种 
大 对 作 在 旅馆 的 观光 旅客 进行 调查 ， 另 一 种 足 在 边防 站 对 印 将 离 境 的 旅游 者 进行 调 
PE. JA 3000 个 作 在 旅馆 的 旅客 的 调查 可 知 其 平均 远 留 时 间 为 17.8 A, TESE 
KAP 12 321 个 即将 离 境 的 旅游 者 的 调 丛 吕 知 其 平均 壕 留 时 间 为 9 日. 由 十 计划 部 门 
的 宫 员 们 对 这 些 数 字 感 到 证 疑 从 而 放弃 了 从 旅馆 旅客 那里 得 到 的 估计 和 值 - 

显然 ,从 即将 离 境 的 旅游 者 方 和 而 所 收集 到 的 观测 值 对 应 于 真实 的 逗留 时 间 分 
布 , 内 而 观测 的 平均 值 9 日 是 期 望 旭 留 时 间 的 有 效 估 计 . 可 以 让 明 ， 当 旅游 者 的 流 
量 达 到 一 个 稳定 的 水 平时 ， 从 旅馆 的 游客 那里 所 得 到 的 逗留 时 间 服从 容量 有 偏 分 
布 , 因而 此 时 所 观测 的 平均 值 为 期 望 近 留 时 间 的 过 量 估计 . 设 OX" 为 容量 有 偏 的 
MpL, 则 

















E(X) =p! (4.40) 

JEU p DEAE REA. A4. 40) de ELE A RARE E HA EGRE 
we BES AED RC TRU, JG ERE E E TILUT LOU FLIRT RUE ET 
一 个 可 与 从 边境 即将 离 境 的 旅游 者 处 所 得 到 的 算术 平均 值 相近 的 估计 什 . 

我 们 感 兴趣 地 注意 到 , 从 旅馆 的 游客 方面 所 得 到 的 估计 值 几乎 是 男 一 个 的 两 
倍 , 这 是 个 与 指数 分 布 有 关 、 产 瀣 等 待 时 间 停 论 的 一 个 因素 (参见 Feller, 

O ERRIAN -MFC MRA HAAN ARAARA, BEA A, 
则 下 “ 辆 公共 汽车 到 站 的 时 间 间隔 为 》 .如果 -个 人 在 时 刻 IARE, REER 
等 待 时 间 的 期 望 值 . 设 等 待 时 间 为 随机 灾 量 w, SER E Go ) 为 多 大 .对 这 个 问题 ,有 了 两 个 不 
DELES 

O) rh TAS IY, M Cus SARER, MA EG) — Ets) 一 Ar 

《ip H TAAI c REDL, WIARE, Elw = pat 

A RATIER, 可 参见 费 御 (1966). — EAE 
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1966; Patil 和 Rao，1977) ,虽然 不 能 肯定 ,但 这 暗示 旅游 者 逗留 时 间 的 分 布 可 能 中 
指数 分 布 - 

假设 对 住 在 旅馆 的 游客 调查 他 们 迄今 在 这 个 国家 所 停留 的 时 间 . 如 果 把 一 个 
游客 到 调查 为 止 所 停留 的 时 间 志 示 为 随机 变量 了, 则 可 假设 v 的 概率 密度 分 布 
与 乘积 变量 X"R 的 概率 密度 分 布 相等 ,这 里 XV Ang EISE] AE EX. BS RC 
形式 , R ARALO, 可 区间 上 的 均匀 分 布 . 并 与 xe fhsrOUB LAE t. 如 令 X 的 分 
ARBOR F(a), 则 Y ARSE aE 


#`il- F(y)] (4.41) 


WRAAE FUITE DR] B y AR Cy), 则 可 用 Y 的 观测 值 米 佑 计 参 数 w， 

在 趣 的 是 , 公式 (4.41) 的 概率 密度 两 数 与 考区 斯 (Cox，1962) 所 研究 的 用 于 
各 种 机 器 的 某 零件 的 失效 时 间 的 分 布 琐 数 - 样 , 这 里 考 克 斯 利用 的 是 机 器 零件 到 
调查 为 止 时 所 使 用 时 间 的 观测 值 . 


4.8 损伤 模型 


设 N 为 随机 变量 , 其 概 浆 分 布 为 p, ，n =1,2,…，,， 民 为 另 -随机 安 攻 ,使 得 


P(R=riN=n)}= s(r, n) (4.42) 

则 R 在 0 处 截断 的 边缘 分 布 为 
p,-üuü- Y Msn, a), r-lb2,- (4.43) 
p= 3nst.0 (4.44) 


原始 数据 n ERI RE, 以 概率 sC, n) 地 减少 到 ,观测 值 > 为 残存 数 ， 
当 我 们 仅 以 生存 的 子女 人 数 (R) 来 考察 家 庭 人 口 的 观测 值 时 ,会 出 现 这 样 的 情况 . 
在 已 知 R 的 分 布 并 假设 一 个 适当 的 生存 分 布 的 情形 下 , 问题 是 如 何 确 定 最 初 家 
庭 人 数 N 的 分 布 . 

设 N 服从 参数 2 的 泊 松 分 布 , BIN —POO, REAS 的 “项 分 布 , 民 一 
Bor). W 


r=1,2,-" (4.45) 


从 (4.45) 可 知 , 参数 A 和 x 是 交织 在 一 起 的 , 因而 即使 给 定 R 的 分 布 , BARER 
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ALON 的 分 布 , 当 N 服从 一 项 分 布 ` 负 一 项 分 布 或 对 数 级 数 分 布 时 ,会 产生 同样 的 
情形 . 斯 普 柔 特 (1965) 在 生存 分 布 为 一 项 分 布 时 , 给 出 了 有 具有 这 种 交织 性 质 的 分 
布 的 一 般 情形 . 槛 恢复 原始 分 布 需要 什么 附加 信息 呢 ? 例如 ， 如 果 我 们 已 知 样本 
中 的 某 些 观测 值 首 没 布 受到 损伤 , 则 可 回 仙 计 二 项 分 布 参数 x 一 样 来 估计 原始 分 
hi. 










这 里 此 注意 的 是 , KEETA H HRPE IAE 2 — BUR 
br = cp (4.46) 
如 果 原 始 分 布 为 泊 松 分 布 , 则 与 (4.45) 一 样 ， 分 布 为 


ewe Ury 
bee ri(l-e™) 
HIRE (Rao and Rubin, 1964) EH ER pt = p^, 具有 泊 恰 分 布 的 特征 . 
劳 (1965) 介 绍 了 于 面 撒 述 的 损伤 模型 . 关于 损伤 模型 的 理论 发 展 以 及 由 此 派生 
出 来 的 概率 分 布 特征 化 方面 的 研究 , 读者 可 参见 Alaid, Rao 和 Shanbhag( 1984) . 
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第 5 章 统计 学 一 一 探求 真理 必 不 可 少 的 工具 
5.1 统计 与 真理 


真理 未 知 亦 难 知 ， 

上 帝 人 间 布 迷离 ， 

deri ARR. 

f Eu du, 

Ad A dpa An, 

茫茫 迹 网 尽 猜 疑 ， 

SEE 34 AE + OC Xenophanes of Kolophon) 
在 第 上 和 第 2 BE, 我 介绍 了 现实 此 办 中 的 不 确定 性 .不 确定 性 的 产生 是 由 
于 缺乏 足够 的 信息 或 缺乏 足够 的 知识 去 利用 有 效 的 信息 ,是 即 使 使 用 精细 的 工 屋 
es AM IRE, 是 神 的 行动 (突然 发 生 的 天 灾难 ), 是 人 类 行为 的 多 样 性 
《这 是 所 有 现象 中 最 不 可 预测 的 ) 在 解释 白 然 现象 时 我 们 只 能 用 枫 率 的 观点 而 不 是 
由 次 定论 的 观点 来 描述 基本 质点 的 随机 行为 . 我 也 痰 到 如 何 和 由 度 旦 化 不 确定 性 使 
我 们 有 可 能 设法 减少 \ 控 制 并 在 做 机 决策 时 考虑 不 确定 性 .在 第 3 和 第 4 章 中 , 我 
讨论 了 向 疯 测 数据 获取 信息 以 及 处 理 不 确定 性 时 数据 分 析 的 策略 .我 强 油 的 是 : 
家 要 收集 于 兆 的 .相关 的 和 诚实 的 数据 , 在 获取 信息 时 此 利用 合适 的 模型 .本 章 
中 , 我 将 更 深入 地 讨论 这 个 主题 , 通过 一 些 实例 来 研究 为 了 在 较 广 的 领域 内 获得 
新 知识 ,为 了 了 解 自 然而 探 米 真理 并 册 在 我 们 口 常 生活 中 做 出 最 佳 决策 ,统计 学 所 
起 的 作用 . 
什么 是 知识 ? 我 们 如 何 去 获 得 知识 ?获得 知识 的 内 在 思维 过 程 以 及 实行 调查 

的 本 质 到 底 是 什么 ? 这 些 问 题 阻碍 人 们 的 才智， 并且 在 哲学 内 争论 了 很 长 时 间 . 
然而 , 由 于 现代 岩 邹 和 统计 科学 的 地 速 发 展 ,我 们 逐渐 开 折 了 接受 新 知识 的 系统 
的 途径 ， 以 重 实效 而 不 是 彤 而 上 学 的 观点 来 解释 “ 息 实 的 知识 ”， 


























(D. hike Xenophanes) RE T6 KLIS JGR 355 一 前 434 华 间 的 古 希 腊 藻 学 家 , 柯 济 丰 
(Kolophon) 态 十 希腊 的 一 个 小 城市 ,到 属 二 年 其 . 当时 的 大 们 喜欢 把 家 乡 名 与 人 名 联 在 Ji, 
ARR ACER COPA PE. ip E 
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5.1.1. 科学 法 则 


科学 法 则 并 不 是 由 权威 的 原理 所 弹 导 的 , 也 不 是 由 信仰 或 中 世纪 芹 


学 来 辨 明 的 ; 统计 学 是 诉 诸 新 知识 的 惟一 法 庭 


马 哈 拉 诺 比 斯 {(P.C. Mahalanobis) 
PATIL SAE A RARE HR HB. 
US BCT. H. Huxley) 
科学 所 涉及 的 是 自 然 现象 的 知识 及 其 进 -- 步 的 完善 .通常 这 些 知识 被 抽象 为 


法 则 (公理 或 理论 )， 可 按 所 要 求 的 精度 去 项 测 林 来 的 








用 的 基础 .例如 现代 技术 所 依赖 的 牛 懒 的 运动 定律 , 爱 











了 件 ， 并 提供 技术 研究 和 应 
斯 坦 的 相对 性 理论 , 博 尔 


的 原子 模型 , 拉 曼 效应 , PT PEAR AE A, USUS DNA 以 及 达尔 文 的 进化 论 等 
等 .我 们 或 许 绝 不 会 知道 什么 是 中 的 法 则 规律 .我 们 研究 的 仅仅 是 由 观测 事实 支持 
的 有 有 用 的 假设 , 并且 随 着 时 间 的 推移 这 些 假设 可 能 被 更 好 的 有 用 的 假设 所 吧 代 ， 
使 它们 在 符合 更 大 范围 内 观测 到 的 数据 的 同时 提供 更 广泛 的 应 用 .我 们 按照 白 己 
对 世界 的 想像 来 研究 世界 “对 科学 来 说 ,并 不 在 平 是 否 真 的 存在 电子 ,只 要 事物 
的 行为 好 像 上 有 电子 存在 一 样 就 够 了 ”Macmurray，1939) .科学 研究 的 方法 包含 在 
图 5.1 那样 的 无 限 循环 (或 螺旋 式 的 ) 的 过 程 之 中 , eH CPopper) ARP, -> 
TT~EE->P,) 的 详细 图 解 , ix P, 表示 最 初 假定 的 理论 , P. 为 修正 了 的 理论 ， 











TT 表示 检验 理论 , FERRARA. 








t) [rr CI 


















































假设 或 理论 推论 (理论 的 验证 ) 
(启发 性 工作 ) 
e ae 
注 绊 推理 归纳 推理 
e) 
试验 设计 
结 果 数据 信息 
(数据 信息 有 效 性 的 保证 ) 
© [6] 


图 5.1 波 帕 科学 研究 公式 的 图 示 
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随 着 更 多 的 数据 的 囚 积 , 甸 - 一 个 假设 部 有 可 能 被 拒绝 . 波 帕 直率 地 描述 了 这 

种 情形 ， 
支持 某 一 科学 假设 的 证 据 仅 仅 是 掩饰 失败 的 一 种 企图 . 

图 5.1t 中 所 大 的 科学 方法 包含 了 两 个 逻辑 过 程 一 一 演绎 推理 和 归纳 推理 , 这 
两 者 之 加 的 区 别 已 在 第 2 章 中 详细 讨论 过 了 . 

如 图 5.1 所 示 ， 我 们 可 知 科 学 研究 方法 有 两 种 形式 , 一 是 (a) ->(b), 然后 
(o) 一 (d) ,这 是 关于 研究 的 对 象 以 及 科学 工作 者 所 起 的 创造 性 作用 的 部 分 . 男 一 
Rie) CD, 然后 (g) -> (h), 这 是 属于 统计 学 研究 的 领域 .所 谢 统 计 学 的 研究 ， 
是 道 过 有效 设计 的 试验 米 收 集 数据 ,经 过 适当 的 数据 分 析 米 验证 所 给 出 的 假设 ， 
并 提供 线索 做 出 可 能 的 亲 换 ,统计 学 能 够 使 科学 家 的 创造 件 的 想像 力 得 到 充分 的 
RE, 去 发 现 新 的 现象 , 而 不 会 在 与 既 存 事实 无 关 的 新 发 现 所 引起 的 波动 上 去 浪 
费时 间 , 统计 方法 具有 很 重要 的 意义 ,特别 是 在 生物 科学 和 社会 科学 领域 内 , 这 
旦 ,观测 值 变动 的 范畴 通 常 比较 大 ,而且 观测 值 的 数量 常常 是 有 限 的 ,在 这 样 的 
情形 中 , 具有 通过 统计 分 析 , 才能 够 对 所 研究 内 容 药 显著 性 做 出 定 硬 知 计 . 

有 关 科 学 研究 小 ,利用 统计 学 原理 进行 有 效 坛 验 设 计 的 重要 性 {图 5.1 中 
(e) > (中), 费 濮 (1957) 评 论说 : 

在 花费 同 祥 的 时 间 和 劳动 下 ,完整 细致 地 检查 数据 的 收集 过 程 ,或 

者 说 试验 过 程 ， 常常 会 增加 10 倍 或 12 倍 的 收益 .实验 结束 后 向 一 个 统 

计 学 家 咨询 的 常常 是 要 他 提出 一 个 后 续 的 检验 .他 或 许 能 指出 实验 失败 

的 原因 . 


5.1.2 做 出 决策 








ARI TER, MARE KA. 
+E 

AMERRE, 我们 必须 面 对 不 确定 性 .不 确定 性 的 表现 形式 依 粮 子 所 提出 
的 问题 . 下面 我 们 给 出 几 个 需要 做 出 决策 的 典型 问题 : 今年 的 卡 米 产量 是 多 少 ? 
某 案件 中 被 控告 的 那个 人 有 罪 蚂 y 某 个 母亲 申 称 闭 个 男子 是 她 孩子 的 千 父 属实 
Wy? 抽烟 是 肺癌 的 原因 吗 ? 斋 天 服 一 片 阿 斯 匹 林 会 减少 心脏 病 的 发 作 吗 ? 从 一 个 
古 墓 中 发 现 的 头 盖 革 号 男性 还 是 女性 的 ? 戏剧 ¢ 险 姆 雷 特 的 作者 是 莎 虐 比 亚 , 培 
根 还 是 马 洛 ? 某 患者 头 部 中 脑 肿 冯 的 正确 位 普 在 哪里 ? 如 何 描绘 世界 上 各 种 不 同 
语言 系统 的 谱系 ? 是 耕 最 后 一 个 出 生 的 核子 与 第 一 个 出 生 的 孩子 的 管 高 有 差异 ? 
AREE, 两 个 月 后 的 黄金 价格 为 多 少 ? 安全 带 的 作用 是 保护 汽车 司机 在 发 后 事 
故 时 不 受到 严重 伤害 吗 ? 行星 会 影响 人 类 的 运动 .行为 和 成 就 吗 ? 占星 术 所 作 的 
预测 准确 吗 ? 
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以 上 这 些 问 题 都 是 不 能 由 哲学 讨论 或 由 经 存在 (或 建立 ) 的 埋 论 米 解决 的 ,也 
不 能 从 有 效 的 信息 或 数据 路 学 出 明确 的 答案 ,这 是 因为 由 任 一 给 出 的 法 则 从 可 能 
的 答案 中 挑选 的 结果 都 有 可 能 受到 汝 闫 的 影响 . 避免 错误 的 男 - 选 迭 是 不 做 任何 
决策 ,但 这 不 会 导 敏 任何 进步 .我 们 所 能 做 的 熙 住 并 案 是 作出 使 风险 映 小 化 的 决 
策 . 我 们 将 讨论 儿 个 用 统计 学 来 解决 这 -… 类 问题 的 实例 . 
5.1.3 统计 学 的 普遍 存在 
统计 科学 给 出 20 世纪 的 一 个 特征 ,反映 了 人 类 进步 独 有 的 一 面 …… 
对 统计 学 家 来 说 ,当今 是 统计 学 一 切 最 重要 活动 的 最 重要 的 时 期 . 
3E ACR. A. Fisher, 1952) 
AK, BEE NYA FE ASE Br Hd At NEUE SRLS AUF 
学 .工程 技术 .管理 、 经 济 .艺术 利文 学 领域 .统计 学 的 普遍 存在 知 图 5.2 Boon. 
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图 5.2 


一 般 人 利用 统计 知识 (通过 在 报纸 和 消费 者 报告 小 获得 的 各 种 各 样 的 数据 以 
及 分 析 ) 在 日常 生活 中 做 出 各 种 决策 , 或 制定 将 米 的 计划 ,或 决定 购买 肌 票 和 股 
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份 来 做 出 明智 的 投资 等 等 .为 了 能 对 所 有 有 有 将 信息 止 确 地 理解 和 应 用 并 提防 那些 
能 将 人 引入 歧途 的 宇 传 广告 ,大 们 有 必要 掌握 -- 定 的 统计 知识 .在 当今 由 科学 和 
技术 控制 的 时 代 里 ,对 统计 学 基本 素养 的 需要 就 如 威 尔 斯 (H.G. Wells) Eft HE R 
ARE 

就 像 读 和 写 的 能 力 一 样 ,将 来 有 一 天 统计 的 思维 方法 会 成 为 效率 公 

民 的 必 备 能 力 . 

对 - -个 国家 的 政府 来 说 , 统计 学 是 一 种 为 达到 特定 的 经 济 和 补 会 且 的 用 十 制 
定 长 期 和 短期 计划 的 工 的 统计 技术 用 于 做 出 人 口 的 预测 以 及 商品 消费 利 
流通 需求 的 据 测 ;中 进步 ,为 了 达到 社会 福利 所 希望 的 目标 ,高 深 的 统计 技术 也 
用 于 由 适当 的 借 者 来 制定 经 济 计划 .有 人 说 “ 越 繁 荣 的 国家 , 统计 越 完备 其实， 
这 句 话 把 央 呆 关系 给 开题 倒 了. 通过 行政 渠道 . 特 儿 的 抽样 调查 以 及 发 展 郑 的 统计 
方法 ， 我 们 能 够 收集 到 大 量 的 社会 经 济 数据 和 人 口 数 据 , He ACR E- 
种 带 有 不 可 预测 成 功 概率 的 赌博 或 者 十 磁 运 气 的 事情 . 在 当今 科学 技术 领域 内 ， 
基于 有 效 的 信息 ,我 们 能 制定 出 最 作 关 策 , 府 由 由 信息 的 反馈 和 控制 可 继续 监视 
所 作出 的 决策 . 

科学 研究 中 , 虐 像 我 忆 提 到 的 ,通过 有 效 没 计 的 试验 来 收集 数据 \ 假 商检 验 、 
林 知 参数 的 秆 证 以 及 对 结果 的 解释 ,对 统计 学 都 起 着 香 鉴 的 作用 . PK 1947 ) 
述 的 血液 类 型 路 Rh Rhesus A THRHR, 就 是 一 个 光 租 的 例子 . 它 品 示 统计 学 如 
箱 帮 助 将 一 个 伍 细 查 基 的 事实 与 此 有 事实 拟 合 , 如 何 构造 新 知识 的 一 个 清晰 的 结 
Hj. 以 太 如 何 发 现 每 个 有 利 点 可 用 二 将 米 的 鲜 究 (参见 椒 章 第 2.18 节 ). 

CAESAR, 特 刘 简单 的 统计 技术 被 用 来 改良 和 维持 产品 质量 ,以 达到 所 期 
望 的 水 于 .人 研究 开发 部 门 进 行 各 种 实验 以 决定 最 佳 皮 方 (各 种 因素 的 组 合 ), 以 此 
来 增加 H Hbi f) Sao s ni I E RE. 是 办 各 地 的 个 普遍 经 验 是 : 使 用 统计 
方法 的 1 上 在 不 增加 投资 和 扩大 TJ 设备 的 情况 下 ,产量 可 增加 10% 到 10096. 
在 这 种 意义 下 , 统计 知识 被 认为 是 国家 的 一 种 资源 . 不必 感到 惊奇 的 症 , Ic h 
版 的 -- 本 关于 近代 发 明 的 著作 小 ,把 统计 质量 控制 列 为 20 世纪 最 伟大 的 技术 发 
gy. - 

的 确 , ARS Ar SUBE ER MES a XE A ILIO I M 380 36:231 ak zn fit 
单 ; 产生 如 此 之 有 效 的 结果 而 利用 却 义 如 此 之 容易 ; 得 到 如 此 之 高 的 效益 而 投资 
却 又 如 此 之 少 . 

商业 中 , 统计 方法 被 用 来 驴 测 商 晤 的 林 米 需求 量 ,制定 咎 产 计 划 以 及 发 展 有 
效 的 管理 技术 以 获得 最 大 的 利润 ， 

Def, 这 验 设计 的 原理 被 用 于 药 效 的 鉴定 及 临床 检验 . 由 大 量 牛 物化 学 和 
其 他 检验 所 提货 的 数据 信和 总 经 过 统计 地 评估 而 几 于 疾病 的 诊断 和 项 测 , 统计 方法 














86 第 5 章 统计 学 一 -探求 真理 必 不 可 少 的 .上 具 





的 应 用 将 专家 们 的 集体 智慧 与 检验 出 的 疾病 之 问 的 差异 结合 起 来 , 已 经 使 得 医疗 
诊断 更 加 客观 了 . 

文学 中 , 统计 方法 被 用 于 测定 个 作家 的 风格 ,对 鉴定 有 争议 的 作者 权时 也 
起 到 作用 . 

考古 学 中 , 由 对 考察 对 象 的 相似 性 的 定量 评估 , 提供 了 找 出 占 代 工艺 品 的 年 
TOUT IS JR. 

WERE F, 某 个 事件 所 发 生 的 概率 的 统计 验证 , HL n BUR DEI (BEI E 
供 和 其 他 证 据 - 

自控 工作 中 ,统计 技术 用 来 帮助 分 析 点 气 滴 滴 的 信息 , 分 怕 AE Re AR 
是 无 关 的 英 至 是 矛盾 的 信息 ， 找 出 其 隆 含 的 模式 .这 类 有 趣 的 情形 可 在 约莫 ' 卡 里 
Qohn Le Carre) 的 《个 完美 的 间谍 》- 书 中 找到 . 书 中 由 “所 有 与 他 们 接触 过 的 人 
的 姓 甸 ,旅行 细节 ,以 及 他 们 接触 时 的 种 种 行为 ,如 性 关系 、 娱 乐 的 欲望 等 等 "的 
信息 与 某 些 事件 的 关联 ,可 以 导出 与 其 个 人 . - 定 的 间谍 活动 有 关 的 结论 . 

可 以 看 到 ,， 如果 在 制定 计划 时 引进 统计 学 的 轧 想 ,引进 可 以 用 来 有 效 地 分 析 
数据 和 评价 反馈 和 控制 的 结果 的 统计 方法 ,肯定 可 以 提高 人 类 活动 的 价 俏 . 无 可 
TrBOBUL. 如 果 有 什么 问题 要 解决 的 活 , 应 求助 于 统计 学 调 不 是 茶 个 专家 委员 . 
会 . 比 起 收集 少数 专家 的 智慧 来 说 ,统计 学 和 统计 分 析 能 给 解决 问题 带 来 更 多 的 





5.2 tse Sk i 


我 将 从 “自然 知识 的 改进 "以 太 成 功 的 “决策 "方面 给 出 部 十 实例 来 证 明 : 甚至 
在 统计 学 还 本 被 承认 是 ?| 独立 的 学 科 以 前 ,统计 学 如 何在 自然 科学 研究 和 其 他 
领域 内 起 着 重要 作用 . 当今 ,在 人 类 活动 努力 的 一 切 范 围 内 , 统计 学 已 经 成 为 -种 
万 能 的 . 强 丰 力 的 和 不 串 缺少 的 斌 究 下 其 . 


5.2.4. 莎士比亚 的 新 诗 : 一 曲 统计 学 的 赞歌 宁 




















这 个 强 有 力 的 旋律 ,将 胜 过 大 理 石 或 者 是 君主 的 金 负 纪念 碑 . 
35 + ke E (Shakespeme) 


1985 年 11 月 14 H, WRH E HOIE RISE ARG. Taylor) M, 1775 年 以 来 就 


他 ”上 海 复旦 大 学 的 李 鉴 平 教授 曾 利 攻 类 似 的 方法 研究 了 我 同文 学 巨著 《红楼 梦 》 的 作者 
BURA SO 回 为 缘 雪 着 之 原著 ,而 后 40 FID ES BST BE. 依照 李 教 授 的 研究 , 前 80 ul 
与 后 和 0 回 确 实 出 自 棒 全 不 同 的 手笔 ， 但 是 ,小 同 诸多 章节 , 至少 经 过 眶 、 六 个 人 收 必 过. 
译 者 注 
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保存 在 Bodelian 图 书馆 的 收藏 中 发 现 了 写 存 纸 片 上 的 儿 节 新 许 . 新诗 上 只 有 429 个 
F, WU IO BOE Re Ve AE. X TERR e E LL DEED fe ih o. pu ETE SEE 
Thisted 和 Efron(1987) 利 用 统计 方法 研究 了 这 个 问题 , 得 到 的 结论 总 这 首 许 用 词 


的 风格 (规范 ) 与 莎 上 比 亚 的 风格 非常 - 禾 . 这 个 研究 纯粹 基 十 统计 学 的 基山 , 其 
过 程 可 描述 如 下 : 











世 知 水 士 比 业 所 有 著作 的 用 启 总 数 为 884 647 个 ,其 中 31 534 个 是 不 同 的 . 
这 些 词 出 现 的 频数 如 表 5.1 所 示 . 


表 5.1 不 同 单词 所 使 用 的 频数 分 布 











单间 使 用 的 频数 不 同 的 单词 数 
m 1 a "143% H 
2 4 343 
3 2292 
4 1463 
5 1043 
6 837 
7 638 
_ > 100 加 E __ 846 — 加 
EK 31534 





3 5. 1 中 所 包含 的 信息 可 用 来 回答 下 列 类 型 的 间 题 , 如 果 要 求 水 十 比 业 写 一 
个 含有 定数 县 单 词 的 新 作品 ,他 会 使 用 多 少 新 单词 (以 前 作品 中 未 使 用 过 的 )? 
在 他 以 前 所 有 的 作品 中 , 有 多 少 单间 他 仅 使 用 过 -次 , BK. 一 次 ，……? 这 些 
数字 可 以 用 费 软 等 C1943) 提 出 的 划时代 的 法 则 来 殴 测 .在 完全 不 同 的 领域 内 , 费 
鞭 利用 他 的 方法 估计 了 未 被 发 规 的 蝴蝶 总 数 1 利用 费 欧 的 理论 , UREE EEH 
与 他 已 有 的 所 有 作品 中 出 规 的 单词 数 884 647 完全 一 样 数 日 的 单词 来 写 他 的 新 的 
EERE, 则 估计 他 将 使 用 约 35 000 个 新 词 .这 种 情形 下 ,莎士比亚 的 总 词 沪 估计 
至 少 有 66 000 个 单词 . [APTE EE MEE FG, 英语 诸 喜 的 总 词汇 约 有 100 000 +, Bi 
前 约 有 500 000 个 .] 

现在 回 到 新 发 现 的 许 上 , 其 含有 429 个 单词 由 有 258 个 是 不 同 的 ,新 诗 的 观 
测 值 和 预测 值 ( 共 于 莎士比亚 的 风 属 } 的 分 布 出 表 5.2( 晤 后 两 栏 ) 给 出 .从 表 5.2 
可 以 看 到 ,( 存 所 期 望 的 差 的 范围 内 ) 两 个 分 布 非常 一 敏 , 这 表示 新 发 现 的 诗 的 
fede TRE EW. 

365.2 rp d H8 CH RA LA A e P8 GER CB. 
Johnson) , 578 (C. Marlowe) ZAG . Donne) KE JLP ARR] BV i oP Pris A A 
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词 的 分 布 频数 .这 些 作者 作品 中 单词 的 分 布 频数 与 新 发 现 诗 中 单词 的 观测 频数 ,以 
及 与 莎士比亚 用 间 风 格 的 期 望 观测 频数 之 间 看 起 来 多 少 有 些 不 同 . 


R52 几乎 同样 长 度 的 诗歌 作品 中 ,莎士比亚 风格 所 含 不 同 单词 




















与 其 他 作者 风格 所 含 不 同 单词 的 频数 分 布 
n L TRENAR O set 
M TOO XH E 多 思 sanus DER 
SEER Cay (uuu) gne) RA mu 
0 8 10 17 9 6.97 
1 2 8 5 7 4.21 
2 1 8 6 5 3.33 
3-4 6 16 5 8 5.36 
5-9 9 n 12 m 10.24 
10--19 9 20 17 10 13.96 
20—29 12 13 14 21 10.77 
30-39 12 9 6 t6 8.87 
40~59 13 14 12 18 13.77 
60—79 10 9 3 8 9.99 
80~99 13 [E 10 5 148. 
”不 同 单词 数 243 m 252 258 258 
单词 总 数 411 495 487 429 





5.2.2. ”有 争议 的 作者 权 : 联邦 主义 青 论文 集 


这 是 与 上 节 密 切 相关 的 验 明 作者 问题 , 或 者 是 对 作者 不 明 的 作品 所 列 出 的 可 
能 的 作者 群 中 去 识别 一 个 作者 ,下 面 我 将 给 你 们 一 个 实例 .这 个 方法 来 源 于 费 歇 ， 
他 是 第 一 个 发 展 这 个 方法 去 回答 一 个 人 类 学 家 向 他 提出 的 问题 的 . 是否 存在 任何 
客观 的 \ 仅 利用 测量 的 方法 能 够 判断 从 丨 中 发 现 的 下 鄂 骨 是 男性 的 还 是 女性 的 ? 

同样 的 技术 可 用 来 回答 本 质 上 相间 的 问题 : 在 两 个 可 能 的 作者 中 , 谁 是 有 作 
者 权 争 议 作 品 的 真正 作者 呢 ? 让 我 们 来 考察 一 下 联邦 主义 者 论文 集 的 情形 . 这 个 
论文 集 是 1787 一 1788 年 由 哈密 顿 (A. Hamilton)、 杰 伊 (J. Jay) A BWE. 
Madison) 为 了 荔 说 纽约 市 民 批 准 宪法 所 著 的 . 按 那 个 时 代 所 时 兴 的 ,这 个 论文 集 共 
含 77 篇 论文 ,全 部 署名 为 笔名 "民众 (Publicus}”, 这 个 论文 集 的 大 多 数 文章 的 真正 
作者 已 经 判明 了 , 但 有 12 篇 文章 仍 存在 争论 ,到底 是 汉密尔顿 的 , VS BED. 
两 个 统计 学 者 , SEE CP. Mosteller) HERE (D. Wallace) (1964) 利 用 统计 方法 
解决 了 这 个 问题 ,得 出 的 结论 是 12 篇 有 争议 的 文章 最 可 能 的 作者 是 马 德 森 . 解决 




















ul 
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这 个 问题 所 使 用 的 度量 化 方法 是 从 有 争议 的 作者 的 作品 年 峡 究 每 个 作者 自己 的 
风格 , 按 其 作品 的 风格 最 接近 于 有 争议 的 作品 米 确 定 其 作者 . 


5.2.3 ”卡尔 特 亚 与 《印度 经 典 》 


卡尔 特 亚 的 《印度 经 典 》 被 认为 是 印度 文学 中 比 其 他 任何 作品 更 明确 描写 古代 
印度 文化 环境 和 实际 生活 的 性 一 的 作品 ,这 部 不 平常 的 作 曾 被 认为 足 公元 前 4 世 
208 #2 BE WCC, Maurya) 的 掌 相 上 尔 特 亚 撰写 的 . 然而 ,不 少 学 者 已 经 对 《 印 
度 经 典 ) 的 作者 和 出 版 的 时 间 产 牛 了 疑问 . 
几 年 前 ， 特 奥 特 曼 (Trautman，1977) 对 《印度 经 典 》 的 作者 和 出 版 时 间 进行 了 
统计 研究 , 发 现 了 《印度 经 典 ) 中 不 同 部 分 的 写作 风格 的 显著 差异 .得 出 的 结论 是 : 
下 尔 特 业 不 是 《印度 经 典 ? 的 惟一 作者 ， 一 定 有 好 儿 个 作者 , 或 许 有 三 到 四 个 作 
者 ,在 不 同 的 时 期 内 写成 ,写作 叶 间 大 约 是 公元 2 warti. 因为 没有 卡尔 特 亚 发 
喜 的 其 他 作品 ， 既 便 假 定 卡尔 特 亚 只 是 《印度 经 典 》 的 作者 之 一 ， 也 很 难 断 定 哪 些 
部 分 是 他 写 的 . 


5.2.4 ”出 版 年 月 


莎士比亚 的 喜剧 《错误 的 言 书 》 和 《 爱 的 徒劳 > 是 什么 时 间 写 成 的 ? 绝 大 多 数落 
士 比 亚 的 作品 均 有 记录 记载 了 出 版 年 月 , 但 也 无 时 间 记 载 的 作品 . 如 何 能 利用 
已 知 出 版 年 月 作品 的 信息 来 估计 其 他 出 版 时 间作 品 的 出 版 年 月 呢 ? 亚 地 (Yardi， 
1946) 在 没有 任何 有 关 作 品 的 其 他 信息 的 情况 下 , 利 由 纯度 景 化 方法 解决 了 这 个 
问题 .他 对 每 一 个 剧本 求 出 各 种 频率 : (i) 元 长 的 县 后 的 音节 ; (ii) 完全 的 分 行 ; 
Gi) 带 有 终止 符 , 但 没 有 分 开 的 行 ; Civ) 对 话 文 的 总 数 .这 样 ,文学 作品 的 风格 被 
度量 化 了 , 利 则 莎士比亚 忆 有 出 版 年 月 记录 的 剧本 的 信息 , 亚 地 研究 了 莎士比亚 
文学 作品 长 时 间 内 风格 上 的 一 般 变 化. 由 此 , 亚 地 利用 播 值 法 推断 出 《错误 的 喜 
剧 》 的 发 表 时 间 大 约 在 1501 ~ 1592 年 笠 ,《 爱 的 徒 浪 》 的 发 表 时 间 大 约 是 1591 — 
1592 FE. 


5.2.5 ”柏拉图 著作 的 系统 排列 


柏拉图 作品 的 问世 已 超过 22 个 世纪 了 , 他 的 哲学 思想 以 及 优美 的 文体 被 广 
泛 地 研究 着 ,遗憾 的 足 , 没有 大 提 太 ,或 者 是 没有 大 知道 他 的 35 ROUES, 6 篇 短文 
和 13 封 信件 写作 的 时 间 年 表 . 柏 拉 图 作品 时 间 年 表 的 问题 19 世纪 就 已 经 提出 来 
T, 但 没有 什么 进展 , 几 午 以 前 , 统计 学 家 开始 着 手 这 个 问题 , 现在 已 给 出 了 一 个 
看 起 来 很 合理 的 解 短 . 

所 用 的 统计 方法 是 从 求 出 作品 之 问 的 相似 性 指数 开始 的 . 在 波 纳 法 (Boneva， 
1971) 的 研究 帆 ， 其 于 衍 - -作品 中 最 后 5 个 音节 的 32 个 可 能 特征 的 频数 分 布 , R 
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出 相似 性 指数 , 这 个 技术 称 为 定性 终 填 ,在 没有 其 他 附 吉 信 息 情形 下 ,这 里 所 用 到 
的 惟一 的 假设 是 写作 时 间 相 近 的 作品 写作 风格 相似 .利用 这 个 方法 推断 了 柏拉图 
作品 的 时 间 年 表 . 


5.2.6 原稿 的 鉴定 


手稿 的 鉴定 或 连接 ， 是 纯 统计 技术 要 解决 的 男 一 个 问题 .根据 尼 卉 (S.C. 
Nita, 1971) 最 近 关 于 罗马 年 代 学 《罗马 历史 》48 个 手 抄 稿 的 研究 , 这 些 手 落 稿 有 
些 是 从 原文 直接 复写 的 , 有 些 是 从 原文 一 部 分 的 手 抄 稿 或 是 几 部 分 的 手 抄 稿 青 复 
写 的 ,这 里 的 问题 呼 要 尽 可 能 的 恢复 诛 作 时 ,并 是 做 出 已 有 手稿 的 连接 .这 里 , 统 
计 学 者 注意 到 了 人 们 在 抄写 手稿 村 不 可 能 不 犯错 误 . 因而 即使 所 有 手稿 来 站 同一 
BC, 复写 时 也 会 出 现 误 养 , 并 且 在 复写 过 程 中 有 可 能 产生 变化 . 一 份 手稿 中 的 
一 个 错误 会 传 给 所 有 的 后 人 , 同 -手稿 的 瑚 份 手 抄 稿 所 含 的 共同 的 错误 ， 比 从 不 
同 手稿 复写 时 产生 的 错误 要 多 .把 手稿 之 间 所 含 的 共同 的 错误 作为 惟一 的 基本 数 
据 , 有 可 能 排列 出 全 部 手稿 的 连接 . 


5.2.7 WAP 





在 研究 印 - 网 语系 之 间 ( 人 包括 完全 不 同 的 拉丁 语 、 伏 诸 、 日 年 曼 语 .斯 拉夫 语 、 波 
罗 的 诺 、 伊 遍 诸 和 克 尔 特 语 等 ) 的 相似 性 时 ,语言 学 家 已 经 发 现 它们 共同 的 语言 原 
形 , 而 忆 验 证 已 经 使 用 了 四 千 五 旧 年 . 如 果 存 在 -个 共同 的 语言 原形 , 则 必然 存 
企 一 个 在 个 同时 期 内 各 种 语言 分 枝 的 进化 怪 系 结构 .有 吕 能 像 后 物 学 家 构造 生命 
进化 谱系 结构 那样 ,类 似 地 构造 语言 的 进化 树 吗 ? disk, 这 是 一 个 有 构 力 的 窜 于 
挑战 性 的 课题 .对 这 样 问题 的 科学 研究 称 为 是 “语言 年 代 学 (glortochronology)”. 
利用 语言 之 间 相 似 性 的 大 量 的 信息 和 复杂 的 推理 , 语言 学 家 能 够 鉴定 语言 的 一 些 
主要 流派 , 但 不 能 建立 它们 之 间 淮 人 确 的 关系 和 分 高 的 时 间 . 但 是 , 由 纯 统 让 学 的 
分 本 研究 ,利用 较 少 的 信息 ,对 这 个 问题 已 经 得 到 了 非常 令 人 鼓舞 的 结果 . 

鲜 究 的 第 - 步 足 比较 属于 不 同 语种 的 - 些 基本 词 计 ， 如 眼 . 手 .母亲 、 一 等 等 . 
属于 不 同 语种 侣 具有 相同 意义 的 词汇 ,， 如果 是 同族 的 标号 为 +， 和 否则 标 为 - . 因 
而 两 种 语言 的 一 种 比较 可 以 表 为 上 各 - 的 符号 列 , 或 是 记 为 向 量 的 形式 (+ ， 
tct, ty) MUR n 种 语言 , 则 有 nla -1)/2 个 这 样 的 相似 性 的 比较 向 
量 . 仅 仅 利用 这 个 信息 ，Swadish(1952) 提 出 了 - -种 估计 两 种 语言 之 间 分 离 时 他 的 
方法 .一 用 知道 所 有 '- 对 一 对 语言 之 辣 的 分 离 时 间 ,， 就 容易 构造 出 一 福 进 化 峙 . 先 
输入 含有 + 号 和 - 号 的 比较 各 量 , 整个 工作 可 简单 地 出 编制 出 的 .能 打印 整个 
进化 树 结构 的 合适 的 计算 机 程序 完成 .近年 ,利用 这 个 方法 由 200 个 词汇 的 列表 构 
造 了 印 -网 语言 树 ;使 用 196 个 词汇 的 列表 构造 了 马 来 语 (Malayo)- 波 利 尼 西 王 
(Polynesian i T7 4 (Kruskal, Dyen 和 Black, 1971). 
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文学 中 统计 学 的 应 用 , 如 估计 范 士 比 亚 作品 的 时 间 、 柏 拉 图 著作 的 年 代 排列 、 
原稿 的 系统 谱系 等 等 , 或 许 有 人 会 对 所 得 结果 (或 所 用 的 方法 ) 怀 有 疑问 .逻辑 上 ， 
这 是 与 下 面 问题 的 意义 相同 的 : 盘 尼 西林 对 某 个 肠 热 病 患 者 有 效 程度 如 何 ? 此 时 
惟一 可 依据 的 是 迄今 为 止 盘 尼 西林 治 您 了 很 多 鹏 热 病 患者 . 但 是 这 种 药 对 某 个 特 
定 的 患者 不 会 失效 玛 ? 同样 地 , 一 个 统计 方法 的 有 效 性 是 通过 所 谓 的 “效率 检验 ” 
来 建立 的 ,所 提出 的 方法 首先 被 用 来 预测 某 些 已 知 的 事件 ,仅仅 当 发 现 这 个 方法 
的 效率 能 满足 要 求 时 才 接 爱 这 个 方法 , 当然 , 为 了 确定 统计 研究 的 结果 ， 如果 可 
能 的 话 人 们 总 是 寻求 独立 的 历史 事实 和 其 他 证 据 . 


5.2.8 ”地 质 年 代 的 尺度 


这 是 费 软 (1952) 所 引证 的 一 个 例子 , 用 来 说 明 地 质 学 中 一 个 最 伟大 的 发 现 里 
面 所 隐 含 的 统计 思想 . 

不 少 人 已 经 熟悉 地 质 年 代 的 尺度 以 及 地 质 层 的 名 字 , 如 鲜 新 世 (Pliocene) .中 
新 世 (Miocene) BE EE (Oligocene), 但 也 许 很 少 有 人 知道 这 些 是 如 何 得 到 的 . 这 
是 由 出 牛 于 1797 年 的 著名 (地质 学 原理 3》 一 书 的 作者 、 地 质 学 家 莱 尔 (C. Lyell) 发 
明 的 .在 1833 年 出 版 的 这 本 书 的 第 三 卷 中 , 他 给 出 了 这 些 时 间 尺 度 的 详细 计算 . 
这 些 时 间 尺度 的 详细 计算 基于 一 个 完全 新 颖 的 思想 并 利用 了 很 复杂 的 统计 过 程 . 

在 杰出 的 贝 类 学 家 德 夏 斯 (M,， Deshayes) 的 协助 下 ,， 革 尔 把 在 一 个 或 多 个 地 
质 层 中 鉴定 了 的 化 石 列 成 表 , 并 查 明 目前 还 生存 的 占 多 大 比例 .就 像 一 个 统计 学 
家 拥有 一 个 没有 记录 年 龄 的 近期 的 人 口 统计 记录 ,以 及 一 系列 未 标明 时 间 的 过 去 
人 口 调查 的 记录 ,从 中 可 以 辨认 某 些 个 人 与 现在 的 记载 是 同 . -个 人 . 在 这 种 情况 
下 , 由 生命 表 的 知识 分 析 可 拟 估 计 未 标明 的 数据 . 即使 没有 生命 表 , 仅仅 由 比较 
每 个 记录 中 现在 仍 生存 的 人 的 比率 , 也 可 以 按 年 代 顺 序 排 成 序列 . 也 就 是 说 , 现 
存 的 生物 在 化 石 中 所 占 的 比率 越 小 , 可 以 推断 其 在 地 层 中 形成 的 年 代 越 长 , 莱 尔 
的 思想 以 及 他 漂亮 的 统计 论证 给 地 质 学 带 来 了 一 场 革命 , 他 所 命名 的 地 质 层 和 其 
他 研究 结果 如 表 5.3 BUR. 












































表 5.3 莱 尔 的 地 质 学 分 类 





生存 数量 





地 质 层 命名 比率 -一 一 一 一 一 一 实例 
不 同化 石 的 数量 
E PiE (Pleistocene) - 96% GECIT 
鲜 新 世 (Plioccene) 40% 意大利 岩石 ,英国 峭壁 
中 新 世 (Miocene) 18% 


始 新 世 (Eocene) 3% 或 4% 
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由 上 述 的 分 类 ,地 质 学 家 可 恨 据 化 石 中 少 关 的 清晰 的 形态 学 上 的 特征 来 确认 


化 右 的 分 层 .遗憾 的 是 ， 人们 在 给 学 生 的 讲授 中 ,从 来 没有 强调 菜 尔 方法 中 隐 含 的 


度 基 思想 . 
5.2.9 鳗鱼 的 公共 繁殖 场所 











下 面 的 例子 选 自费 和 软 (1952) 的 文章 , 灌 明 如 何 由 基本 的 描述 统计 





的 知识 引 





出 一 个 重要 的 发 现 . 





20 此 纪 旱 期 , SEA MEHL As ERES RO D SERE C). Schmidt) 发 现 不 同 地 区 所 
捕获 的 间 种 鱼 类 的 痊 枞 骨 和 鱼 线 的 数量 有 很 大 不 问 ;其 至 存 同 一 -海湾 内 不 同 地 点 





所 捕获 的 同 种 鱼 类 ,也 发 现 这 样 的 自身 .然而 , 鲍鱼 的 肖 检 内 的 数量 变 





LARK. E 





密 特 从 欧洲 各 地 VK WEIR BES VA A JL ES L PAD RO E R E E RA AK B 00 
鱼 的 样本 中 ,计算 发 现 了 几乎 REB CA AR ME HR X (LL. 由 此 , 施 密 特 推断 所 有 
各 个 不 同 海域 内 的 鳗鱼 是 由 海洋 中 此 公共 场所 繁殖 的 .后 来 名 为 “ 戴 纳 (Dana)" 的 


科学 考查 船 在 一 次 远征 中 发 现 了 这 个 场所 . 
5.2.10 “人 所 具有 的 特点 是 遗传 的 吗 ? 


这 个 问题 是 在 一 次 讨论 达尔 文 的 理论 时 提出 的 .为 了 四 答 这 个 问题 , 丹麦 的 
一 个 遗传 学 家 约 输 尼 森 (W. Johannsen) 进行 了 实验 , 他 的 实验 已 经 出 现在 今天 的 
教科 书 上 ,但 是 在 他 1909 年 第 一 次 发 表 这 个 结果 时 却 没有 引起 注意 . 下面 是 我 从 
卡 克 (M.Kac) 的 一 个 笔记 (1983) 中 引用 的 , 卡 克 分 绍 了 当 他 13 岁 时 所 了 解 的 这 个 


实验 . 


“约翰 尼 森 取 了 大 量 的 豆子 , FENDER, 由 这 些 重量 做 成 频率 贞 方 图 并 
由 此 拟 合 了 今日 被 称 为 正太 分布 的 曲线 . 然后 ， 他 从 中 取出 大 的 和 小 的 豆子 , 分 
SET AUS, HAR CIE BRET RRA ER el 
与 正 态 曲线 拟 合 . MRL SK Roe f, 则 大 们 可 以 预期 后 做 的 两 条 曲线 会 
以 大 小 不 同 的 均值 为 分 布 中 心 . 但 是 , 事情 恰恰 不 是 这 样 , 两 条 册 线 与 它们 祖先 
的 曲线 几乎 看 不 出 区 别 , 因 此 六 后 了 一 个 严肃 的 问题 : 豆子 的 大 小 是 洁 是 遗传 



































的 .” 卡 克 继续 介绍 说 : 


当时 那些 完全 新 新 的 议论 使 我 感到 很 吃惊 ,直到 今天 还 保留 很 深 的 


印象 ,这 是 我 当时 在 已 接受 的 数学 .物理 和 生物 学 知识 中 还 未 过 到 过 的 . 
从 那 以 后 , 我 开始 学 习 了 大 量 的 统计 学 知识 , 甚至 还 给 具有 不 同 数学 程 
度 的 人 讲授 统计 学 ,但 我 始终 认为 约 输 尼 森 的 实验 是 我 所 知道 的 关于 并 








述 统计 推断 方法 之 有 效 .之 精彩 的 最 好 的 例证 ， 
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5.2,11  ZMECT EE EE 


RAYT LEA T RAEI TL, EE RE AR R A 
FEAR. JLAEVA SG, CUBE SEET ATASSRAEWTCT. A. Davis) 就 这 个 问题 进行 了 调查 研究 . 
他 的 研究 ,为 统计 方法 在 了 解 白 然 相 质 中 的 应 用 , 提供 了 一 个 极 好 的 例子 .也 就 是 
说 , 市 规 测 事实 提出 新 间 题 , 为 解决 这 些 新 的 问题 , 要 做 出 更 进 --- 步 的 观测 .综合 
每 个 阶段 所 得 到 的 结果 ,寻找 新 的 让 据 来 加 强 已 有 结果 的 基础 并 探索 新 的 方向 . 

为 信 么 有 的 情 的 树叶 是 左 螺旋 形 的 ,有 的 是 右 螺旋 形 的 呢 ? 这 是 个 遗传 特征 
V? 此 回答 这 个 癌 题 , 可 以 考虑 由 不 同 螺旋 形状 的 树木 组 合成 公 亲 树 ， 并 分 类 计 
算 所 产生 的 了 和 孙 树 具 有 相同 特征 的 数 基 .为 此 目的 所 收集 到 的 数据 列 在 表 5.4 中 . 
可 以 看 到 , 左 对 右 的 比率 在 所 有 类型 的 双亲 树 的 组 合 小 儿 乎 是 一 样 的 .这 显示 了 
Fe WR ioe RE AS Jc Po RU EA. 


RSA ”不 同 种 类 交配 后 所 产生 的 子孙 树 中 左 螺旋 和 右 螺 旋 的 比例 











双亲 的 双亲 的 子孙 树 
花粉 FE mido 
* 右 44.56 
f 不 41:53 
在 在 45:55 
Es 左 47:53 





因而 , ARER £r AER LEA E st eJ V BEL eB POE ET EE. 
BE, 为 什么 作 表 5.4 观测 的 数据 中 , BRE T PIRE Ri HOC (10 5596) 90. 其 生 
长 环境 中 一 定 存 在 很 大 的 可 能 性 使 得 树木 的 叶子 向 右 螺 旋 . 如 果真 是 如 此 , 这 种 
可 能 性 依赖 于 树 的 地 理 位 置 吗 ? 由 于 还 没有 从 世界 各 地 收集 到 数据 , 不 能 明确 加 
答 这 个 问题 . 已 经 发 现 , 从 地 球 北半球 收集 到 的 样本 中 , 左 螺 旋 的 比例 占 0.515， 
而 从 南半球 收集 到 的 样本 中 , AREH 0.473. 这 个 差别 恶 怕 臣 受 地 球 绕 一 个 六 向 
自转 的 影响 .这 也 解释 了 浴 提 中 旋涡 的 原理 ( 当 抽 取水 栓 排除 浴缸 中 的 水 时 ,会 产 
FERRAR) A, 在 良好 控制 的 条 件 下 , 北半球 的 旋涡 多 是 反 时 针 方 向 
的 , 南半球 的 旋涡 多 是 顺 时 针 方 向 的 . 

如 果 戴 维 斯 不 是 热心 人 寻找 左 螺旋 和 石 螺旋 树木 不 同 的 特征 ,他 的 研究 仪 会 
保留 菜 些 学 术 上 的 特点 . 戴 维 斯 化 了 12 午 多 的 时 间 在 一 个 大 种 植 轩 中 比较 了 左 螺 
旋 各 右 蝶 旋 尾 的 平均 产量 .他 十 分 你 育 地 发 现 , 左 螺 旋 形 树 的 产量 高 出 右 螺旋 形 
W 10% .虽然 还 不 能 做 出 任何 解释 一 一 这 个 问题 不 容易 解决 ,需要 进行 进步 
研究 但 这 个 经 验 的 结论 任 经 济 上 是 很 掉 要 的 .只 选择 种 植 左 螺旋 形 的 树木， 
产量 可 提高 1096! 戴 维 斯 继而 提出 了 下 而 的 问题 ; 慌 用 左 于 的 女性 是 否 比 惯用 右 
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手 的 女性 更 具 想 像 力 . 棱 福 德 公司 提供 的 研究 去 明 , 惯用 左手 的 人 具有 特别 的 创 
造 力 而 量 长 得 漂亮 .所 有 惯用 左 于 的 人 中 引 以 自 迪 的 黄 名 人 物 有 : PAR AEE 
林 , xe ZEE, RAWE, 亚 力 山大 大 沉 , RARA . 

大 螺旋 和 右 螺旋 的 现象 在 植物 王国 中 是 非常 普遍 的 . 你 或 许 还 没有 注意 到 你 
的 花园 中 , 同 RY FA ER J A Be A RE HO. AE BER ERRA 
BLA PRBS, 有 的 仅 是 左 方向 的 . 在 加尔各答 印度 统计 研究 所 ,研究 者 企 
图 改变 这 个 习 避 所 做 的 实验 以 失败 告终 .看 起 来 这 些 植物 顽强 地 抵抗 任何 这 样 的 
尝试 . 

更 麻 层 地 足 ,除了 非常 低级 的 床 始 形式 外 , 所 有 生物 有 机 体 的 生化 结 梅 是 左 
手 形 的 .除了 甘油 外 , 所 有 的 氨基 酸 (Amino acids(D&L)) 都 分 为 两 种 形式 : LAE 
旋 ) 和 DIE). ABA L A D 相互 是 镜像 关系 ,分 别称 为 左旋 形 分 子 和 回旋 形 
分 子 .在 植物 和 动物 的 伐 白 质 中 , 其 至 在 简单 的 有 机 体 , TARDE RETI EE HY 
所 发 现 的 所 有 24 种 氨基 酸 均 起 左旋 形 的 .所 有 左旋 形 和 右 旋 形 分 子 均 有 完全 相同 
的 性 质 .生命 可 能 在 仅 有 DREK), 或 是 L UD BUE QE X PEE. 那么 ,生命 
有 机 体 的 进化 ， 比 起 Dt 右 旋 ) 分 子 , 更 惹 意 选择 L( 左 旋 ) 分 子 是 自然 界 中 的 偶然 
现象 吗 ? 或 者 是 说 , 左旋 分 子 可 能 天 牛 地 适应 于 有 机 体 的 构造 吗 ? 左边 倾 象 或 许 
有 什么 神秘 的 力 基 ,人 们 还 得 从 科学 上 去 探索 

得 到 已 故 中 度 统计 研究 所 的 戴 维 斯 博 上 许可 所 给 出 的 图 5. 3 中 ,清楚 地 显示 
了 左右 方向 缠绕 植物 的 息 苏 和 花 辩 的 左右 排列 . 

PRU ARIAT ATG HGR. Sperry) E LEG) TORIES MAES AE EA 






























[E Ift: 


YN 








5.2 X e X 95 





脑 的 控制 时 ,发 现 受 堪 脑 控 制 的 人 后 多 数 .简单 的 说 ， 其 特征 就 是 : 相对 于 受 右 脑 
控制 的 人 的 创造 能 力 , 受 左 脑 控 制 的 人 更 具有 远 辑 推理 能 力 . 


5.2.12 ”日 内 循环 


如 果 有 人 问 你 的 身高 是 多 少 ， 你 会 立即 给 出 答案 一 一 某 个 特定 的 数字 . 你 的 
身 遍 己 经 补 果 大 在 某 个 时 刻 测 车 过 了 , 并 给 了 你 这 个 数字 .但 是 你 可 能 不 会 赣 求 
去 回答 为 什么 这 个 数字 能 有 效 地 代 皮 你 的 二 高 .如 果 你 依 实 考虑 答案 的 话 , 则 应 该 
是 一 个 仔 纲 按 照 "测量 高 度 规定 的 过 程 " 所 得 到 的 一 个 观测 值 . 这 样 一 个 关于 身高 
量度 的 定义 能 满足 所 有 实用 的 目的 . 仙 是 出 现 了 共 他 问题 : 我 们 所 要 测量 的 ( 按 规 
定 的 方法 ) 身高 依赖 上 一 天 之 内 不 同 的 测量 时 间 吗 ? 也 就 是 说 , 如 在 一 大 内 不 同 
的 时间 测量 这 个 值 会 发 牛 变化 吗 ? Bai E, 我 们 如 何 确定 这 个 值 呢 ? n, 
人 的 身高 ( 真 货 ) 蛙 上 和 晚上 有 差别 吗 ? 如 果 有 , 这 个 差别 有 多 大 ? 有 任何 生理 上 
的 解释 吗 ? 

一 个 简单 的 统计 调查 可 以 给 出 答案 . 分 别 在 时 .上 和 晚上 仔细 测量 了 加 尔 各 管 
41 个 学 生 的 身高 ,发现 早上 的 测量 但 高 于 晚上 的 测量 值 ， 其 平均 差 为 9. 6 毫米 
( 劳 , 1957) .事实 上 ,如 凡 假 设 -天 之 内 不 同时 间 测 其 的 身高 是 没有 差别 的 话 , 则 
所 出 现 的 任何 观测 值 的 差别 吓 以 目 因 于 测量 上 的 误差 ,其 以 相等 的 概率 可 以 在 正 
负 两 个 方向 上 产后 .在 这 个 假设 下 , 所 有 AL 个 学 和 持 测定 的 差别 为 正 ( 即 早 上 的 身 
高 值 较 大 ) 的 概率 为 2““,， 即 这 个 事件 (测量 误差 为 正 ) 存 10” 次 实验 中 最 多 发 生 5 
次 .也 就 是 说 , 上 反对 身高 无 差别 的 假设 的 比 举 非 常 高 , 看 起 来 , 我 们 夜间 睡眠 时 身 
高 要 长 1 厘米 , 而 白 厂 工作 时 却 要 缩 碱 上 厘米 . 

BUS E SR T TH Ere ERE, 那么 下 一 个 问题 也 许 就 是 : 当 我 们 进入 睡 
眠 时 ,身体 的 哪 一 部 分 在 仲 长 网? 为 了 检验 这 … 点 , 分 别 在 曲 晚 对 丹 体 做 了 记号 
的 几 个 点 之 间 进 行 了 测 旺 . 发 现 整个 身体 约 有 ! 原 米 的 差别 产生 在 湖 稚 部 分 . 生 
理学 上 的 说 明 是 ， 白 天 因为 椎 骨 之 间 的 软骨 ( 检 间 板 》 的 收缩 HE AE A 
近 ; 而 夜里 当 身 体 放 松 时 , 椎 骨 又 回 到 康 来 的 位 置 . 

为 什么 教师 愿意 在 早上 授课 呢 ? 这 存 因 为 教师 和 学 生 在 早上 精力 充沛 , 互相 
之 间 非 常 和 谐 . 这 个 现象 有 任何 生 奋 学 上 的 解释 吗 ? 

从 体内 侨 染 中 可 的 松 ( 一 种 荷尔蒙 ) 成 分 的 变化 可 以 解释 我 们 存 上 午 的 机 敏 
人 性. 正常 状态 下 , RE S 点 时 ， 人 体内 的 可 的 松 水 平 为 每 100 EAA 16 微克 
(165g/100mD , 然后 逐渐 下降， 至 晚上 11 点 为 每 100 毫升 含 5 微克 (6hgj100mi) , 
降低 了 60% .早上 可 的 松 的 升 高 俱 人 起 床 ,到 晚上 的 下 活 则 诱 人 人 睡 .因此 , 我 们 
在 上 午 是 机 敏 的 ,当代 晚 渐渐 降临 时 , 我们 会 变 得 迟缓 起 来 . 

实际 上 ,就 如 身高 所 显示 的 情形 一 样 , 人 类 的 几 个 生理 .上 的 特征 -一 大 中 在 不 
断 变 化 ,也 就 是 以 24 小 时 为 周期 ， 每 个 人 有 自己 特别 的 H 内 循环 . A 
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(Halberg, 1974) 强 调 了 研究 这 样 的 变动 的 重 此 性 , 艺 所 请 时 间 生 物 学 ,就 如 凑 定 趾 
者 服药 的 最 佳 时 间 . 可 以 证 明 一 天 之 中 应 在 某 -时 刻 服用 的 药 ,在 其 他 时 间 服用 是 
无 效 的 ; 服 几 药 物 的 有 效 释 度 也 许 依赖 于 不 同时 间 内 血浆 中 各 种 生化 物质 的 水 
平 .时 间 生 物 学 山 成 为 一 个 具有 广泛 应 用 前 景 的 活跃 的 研究 领域 . 这 些 研究 中 , 大 
多 数 发 展 是 基于 统计 技术 来 发 现 并 建立 不 同时 间 内 测量 值 的 周期 性 . 


s.2.13 BARA 























假 没 一 个 母亲 声称 某 个 男子 起 她 忌 子 的 生父 ,但 是 那个 男 千 却 不 承认 .我 们 能 
够 计算 被 控告 的 都 个 男子 是 孩 了 牛 父 的 可 能 性 大 小 吗 ? 或 许 这 个 计算 结果 能 与 其 
他 证 据 一 起 用 于 帮助 法 庭 米 裁决 这 个 事件 .很 多 因 家 的 法 庭 在 裁决 自 亲 关 系 时 , 接 
受 统计 方面 的 证 据 . 

通常 ,这 样 的 让 据 是 基于 血液 级 或 DNA 链 的 匹配 检验 的 .在 某 些 事件 中 指认 
的 父亲 和 和 孩子 的 血液 组 或 DNA 链 检验 可 能 不 能 导出 决断 性 的 结论 来 裁定 母亲 的 
申诉 是 错 的 .然而 ,即便 血液 组 或 DNA 链 检 验 是 匹配 的 ,这 也 并 不 意味 申诉 是 让 
确 的 .在 这 种 情形 下 ,我 们 能 计算 出 申诉 止 确 的 概率 , 如 时 这 个 概率 值 很 大 又 有 其 
他 的 证 据 , 就 有 吕 能 接受 申诉 . 


5.2.14 ”统计 学 中 的 盐 





























Ue 而 且 , 我 平生 所 讽 之 最 不 平常 的 一 件 事 ,是 我 在 一 本 哲学 著作 
中 发 现 食盐 的 用 量变 成 了 一 次 雄辩 的 争议 的 主题 ,其 他 许多 类 似 的 事情 
也 受到 类 似 的 称赞 . 
Pheadrus (#4 dir EB iy“ 3€ HY B E") 
1947 年 印度 刚 独 立 , 德里 就 发 生 了 一 些 公 共 烘 乱 .一 个 少数 民族 团体 中 的 大 
多 数 人 避难 到 被 称 为 红色 保 垒 的 地 方 , 这 是 一 个 被 保护 的 区 域 , 少 部 分 人 逃 到 另 
一 个 地 区 的 修 姆 办 庙 里 ,这 个 庙 临 近 一 个 古 建筑 物 ,政府 有 责任 提供 食物 给 这 些 避 
难 者 .这 个 任务 委托 给 了 承包 商 , 由 于 没有 任何 关于 避难 者 人 数 的 信息 ,政府 被 扎 
接受 和 付出 承包 商 所 提出 的 为 避难 者 所 购买 的 各 种 日 用 品 和 生活 保 让 品 的 账单 - 
政府 的 这 项 开支 看 起 来 非常 大 , 因而 有 人 建议 让 统计 学 家 (他 们 能 计算 ) 来 求 出 红 
色 城 保 中 避难 者 的 正确 人 数 . 
在 当时 的 混乱 条 件 下 ， 这 个 问题 看 起 来 很 困难 . 另 一 个 复杂 的 情形 是 , 政府 
所 请 的 统计 学 家 是 属于 多 数 派 团 体 的 (与 + a IM PERE, 内 而 如 果 要 应 用 
统计 技术 估计 避难 者 的 人 数 而 要 求 进入 红色 城堡 的 活 , 这 些 统计 专家 的 安全 没有 
保 让 . 搜 在 统计 学 家 面前 的 问题 是 : 在 没有 任何 避难 者 人 数 的 先 验 信息 、 没 有 任何 
机 会 占 接 了 解 那个 地 区 和 人口 密度 的 情形 下 ,同时 在 不能 使 用 任何 已 知 的 用 于 估计 
或 人 口 统计 调查 中 的 抽样 技术 条 件 上 ,来 估计 个 给 定 地 区 的 人 口 数量 . 
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专家 们 不 得 不 想 出 某 个 办 法 来 解决 这 个 问题 .无 论 是 统计 学 或 号 统计 学 家 的 
失败 , 政府 都 是 窑 忍 的 .不 管 怎样 ,统计 学 家 们 接受 了 承包 商 交 给 政府 的 账单 , 这 
些 账单 记载 了 提供 给 避难 者 的 不 同 的 生活 用 品 , 如 所 购 入 的 米 、. 豆 类 和 盐 . 如 何 利 
用 这 些 资料 吏 ? 

假设 全 体 避 难 者 ADI RAR BOW R, P, S 由 消费 调查 ， 
每 人 每 天 所 需 归 这 些 食物 的 量 分 别 设 为 >， 户 ， s. HT R/r, Pip, Sis, 提供 了 

-个 集团 中 相同 人 数 的 平行 估计 量 ， 也 就 是 说 , 这 三 个 值 尤 沦 哪 一 个 均 是 等 价 有 
效 的 .专家 们 利用 承包 商 提出 的 RR. P，S 计算 了 这 些 值 , RA S/s 最 小 , 而 表示 
大 米 的 Rir BA, 与 盐 相 比 , 商 闻 中 最 贵 的 大 米 的 蔓 有 可 能 被 全 大 了 . (当时 在 印 
Ben fH TEE, INTUS RECO BE (RU BEL) 因此 , 统计 学 家 提出 估计 值 S/s 为 
红色 域 供 中 避难 者 的 人 数 .对 所 提出 的 这 种 方法 的 验证 是 用 同样 的 方法 独立 地 人 
计 了 休 姆 因 庙 里 的 避难 者 人 数 ( 这 里 的 入 数 要 少 得 多 ), 得 人 旬 了 很 好 的 近似 值 . 

这 个 基于 盐 歧 的 估计 方法 思想 来自 森 十 普 塔 .MSengupta) ,他 长 期 在 印度 
统计 研究 所 工作 .由 统计 学 省 所 给 出 的 舍 计 值 对 政府 做 出 行政 管理 决策 时 非常 有 
用 . 这 也 提高 了 统计 学 的 威信 , 从 那 以 后 , 统计 学 受到 政府 的 大 力 支 持 . 串 以 说， 
这 个 倘 计 方法 对 印度 统计 学 的 发 展 做 出 了 很 大 的 贡献 . 

这 里 所 用 的 方法 在 任何 教科 书 中 都 设 有 记载 , E-A AEA T BL Pb iG 
方法 .这 个 思想 的 背后 足 统 计 的 推 青 或 定 景 的 思考 ,或许 也 可 以 说 包含 了 一 种 艺术 
成 分 吧 ， 


5.2.15 ”血液 检查 中 的 经 济 学 


我 已 经 举 了 儿 个 例子 米 说 明 统 计 学 的 成 功 ,这些 例 了 中 ,尽管 涉及 到 数据 与 
方法 沦 这 是个 已 被 普遍 接受 的 统计 思想 , 但 更 重要 是 ARE GRIA. 下面， 
作为 同样 的 统计 学 一 闻 定 义 的 第 三 个 方面 , 定量 塌 考 可 被 视 为 是 创造 性 来 源 的 基 
础 .我 再 举 岗 个 例子 . 

第 二 次 世界 大 战 期 间 , 必须 征 慕 很 多 人 到 军队 ,此 检查 申请 者 中 某 种 罕见 的 
疾病 寅 要 对 每 一 个 人 进行 血液 检 售 ， 这 无 疑 是 -- 项 正大 的 工作 . 尽管 被 淘汰 的 比 
率 很 低 , 但 这 全 检验 昆 决定 一 个 人 是 售 能 参军 的 关键 .如 何 保证 “下 问 题 的 "会 被 
淘汰 掉 , 同时 又 减少 检验 次 数 呢 ? 这 人 在 教科 - 肯 上 是 没有 答案 的 ,这 里 介绍 一 个 统 
计 学 家 窗 有 才气 的 解答 . 

假设 申请 者 中 平均 20 个 人 中 有 -个 人 患 紫 病 , 也 就 是 说 , 将 申请 者 20 个 人 
BA “组 ,对 每 一 组 进行 20 次 血液 检验 , 则 平均 每 一 组 有 一 例 半 阳性 .显然 , 如 
果 把 儿 个 人 的 血样 混合 起 来 进行 检 但 ， 仅 当 全 少 有 一 个 人 的 血 蔡 阳性 时 混合 血样 
ABEL GE. RE 20 次 单个 检验 , 我 们 把 20 个 人 分 为 两 组 , 对 10 个 人 一 组 的 两 
个 混合 血液 样本 分 别 进行 检验 .平均 来 说 , 此 时 一 个 混合 样本 呈 阳 性 ， 另 一 个 旦 
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阴 件 .然后 仅 对 呈 取 性 的 混合 样本 进行 单个 检验 ， 以 确认 哪 一 个 人 的 血液 是 阳性 
的 ,这 样 , 对 每 20 个 人 一 组 平均 仪 击 2+ 10 = 12 次 检验 ,， 即 减少 了 20 次 中 的 8 
次 ,或 减少 40% .可 以 看 到 , URIE 20 个 样本 按 5 个 一 组 进行 混合 ， 则 平均 实验 
总 数 仅 有 4+5 =9 次 ,这 是 对 每 20 个 申请 者 -组 进行 检验 所 涝 次 数 的 域 佳 值 , 衙 
HT 11 次 , Bl 55%. 

PRADA EVE Vi SR Tet Fe (e SER RIOT RE UR e Po BO UCET. 如 果 假 设 其 种 疾 
病 个 人 患 病 的 比率 为 +, 则 进行 血液 检查 时 , 混合 样本 人 数 大 小 的 最 佳 值 应 为 使 
7 2)" - ln CAT .一 个 最 好 的 方法 得 介 最 传 值 x 的 过 程 , 是 对 不 同 的 x 
PURER HH GBC - x)" 一 《ljn) 的 值 , 选 样 其 中 最 大 值 所 对 应 的 m . 

这 个 思想 非常 河上 党 ,村 用 于 其 他 领域 .例如 ,常常 要 对 来 自 不 同 水 源 的 水 进 
行 检验 ,确定 是 耕 被 污染 , 按 上 面 所 描述 的 湿 合 样本 和 分 组 的 试验 手段 , 则 有 可 能 
在 不 增加 实验 设备 的 情况 证 ,检验 大 量 来 白 不 同 水 源 的 样本 并 能 做 出 精密 的 检 
查 . 混 合 样本 检测 的 方法 磺 已 广泛 实践 于 环境 保护 研究 和 其 他 领 咸 ,用 二 削减 实验 
检测 费用 . 


5.2.16 ”为 增加 粮食 生产 而 建设 机 械 工 厂 


到 1950 年 , EDEE R BEA" 100 万 吨 钢 , 有 人 建议 修建 一 个 工 | 来 多 生产 100 
万 吨 钢 .根据 这 个 建议 , 专家 们 对 当时 的 钢铁 需求 量 进 行 了 调查 , 估计 为 150 万 
吨 . 基 于 这 个 数字 , 对 提议 建 三 再 生产 100 力 吨 钢 是 否 明 智 产 牛 了 疑问 .最 后 , 这 
个 建议 被 取消 , 代替 的 是 推荐 政府 从 国外 购买 不 是 的 50 万 吨 钢 . 

这 个 决议 成 许 是 基 二 完全 的 经 济 学 理论 .计算 上 看 不 出 有 什么 错误 .位 足 ， 可 
以 说 这 个 决议 是 缺乏 远景 规划 的 . 问题 是 ,这 个 决议 没有 对 国家 整个 经 济 的 发 展 ， 
以 及 各 经 济 活动 领 咸 内 自我 充 是 的 最 终日 的 进行 验证 . 阻止 修建 新 的 炼 钢 厂 的 专 
家 委员 会 的 决议 ,结果 使 国家 花费 了 扩 和 万 卢比 从 同 外 进 11 锅 铁 . 下 我 们 来 看 看 统 
计 学 家 马 哈 拉 详 比 斯 (1965) 如 何 评论 这 个 问题 ， 

每 年 , 印度 的 人 口 按 700 万 人 的 比率 增 攻 .因此 , 今后 5 年 党 费 扣 供给 增加 人 
口 的 必需 的 粮食 痊 租 为 1500 万 吓 . 如 果 我 们 不 得 不 进 上 这 些 粮食 , 按 人 世界 市 场 价 
格 每 吨 90 美元 计算 , 今后 S 年 内 必须 支付 13 亿 或 14 亿美 元 的 外 汇 . 

为 了 和 牛 产 1500 万 吨 粮 食 , ALTE MERE 750 万 吨 化 肥 C. 按 进口 化 肥 每 吨 50 美元 


O 作者 举 这 个 例子 是 想 说 明 事 物 之 问 是 五 相 联系 ,互相 影响 的 , 不 能 简单 ,孤立 地 看 问 
题 .这 个 例子 中 的 数据 恶 怕 是 数学 家 居 度 出 来 的 ， 不 切合 实际 .实际 上 ,无 论 哪 个 国家 ,化肥 都 
比 面粉 贵 . 施 一 是 化 肥 生 产 两 吨 粮食 的 比例 如 果 是 真 的 , 农民 肯定 不 会 使 用 化 肥 . 译 者 认为 , A 


正 的 比例 应 在 布 ~ 52:181. 一 一 译 者 注 
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的 价格 计算 ,5 年 内 要 支付 的 总 额 不 到 4 亿美 元 .这 样 说 米 , 不 进 1{ 粮 食 而 进 11 化 
阳 的 决定 不 是 风 联 明 - 些 吗 ? 
-个 化 取 广 的 外 汇 支出 仪 为 5000 万 到 6000 万 美元 就 是 
够 了 .为 了 生产 -所 中 要 数量 的 化 取 我 们 需 上 要 修建 五 座 这 样 的 工厂 . 修建 这 些 上 厂 
的 总 的 支出 不 到 3 亿美 元 . 啊 有 ,附加 的 优点 是 : 这 些 工厂 5 件 以 后 , 将 继续 生产 
化 肥 . 代 蔡 进 口 化 肥 而 修建 牛 产 化 民 的 工厂 的 决定 不 是 更 网 明 一 些 吗 ? 

再 进一步 , 考虑 修建 能 生产 化 肥 机 械 的 下 厂 .为 此 所 需要 的 外 汇 仅 为 5000 万 
到 6000 万 美元 就 足够 了 . 这 样 仅 5000 方 到 6000 万 的 投资 ,能 获得 3 亿 或 4 亿 ， 
其 至 14 亿美 元 的 收益 . 办 此, 修建 “个 机械 制造 工厂, Je SE y 

这 些 议论 就 如 下 面 所 说 : ANGER, IRE THe, 缺乏 马 掌 , 就 缺乏 马 ; 
缺乏 己 RREZET; 缺乏 骑手 , 就 会 广 

印度 有 些 经 济 学 家 评论 aeter ta lo oe 与 经 济 原理 不 协调 .但 是 , 回顾 
一 下 , 我 们 已 经 看 到 马 哈 拉 诺 比 斯 的 计划 对 印度 的 工业 化 起 到 了 作用 . 


5.2.17 ”小 数位 数字 的 遗失 


一 个 统计 学 者 常常 被 改 求 去 分 析 他 人 所 收集 的 数据 , 有 时 , 收集 数据 的 代价 
很 大 而 收集 信息 的 日 的 并 不 明确 . 这 时 统计 学 者 首先 要 作 的 是 阁 问 数据 的 调 介 者 
了 解 有 关 数 据 的 如 下 间 题 : 收集 数据 的 个 体 所 属 的 总 体 、 对 象 以 及 区 域 如 何 ;所 用 
的 抽样 方法 以 及 次 定 测定 值 的 概念 和 定义 如 休 ;为 获得 测量 值 而 雇用 的 调查 代理 
《个 人 或 使 用 的 器 其 ) 如 何 ; 如 有 调查 表 , 是 否 可 以 检查 或 者 交叉 检查 ? 数据 中 是 否 
有 从 别 的 出 版 物 或 者 通过 另外 途径 获得 的 部 分 ? 最 后 ,所 做 调查 的 日 的 是 什么 ? 
菜 于 所 收集 的 数据 有 什么 特殊 的 问题 惨 回 答 . 如 果 统 计 学 者 与 调查 者 之 间 不 能 开 
相 理 解 对 方 的 “语言”, 则 雌 者 之 间 的 交流 就 会 存 让 一定 的 济 难 . 如 果 双 方 能 做 一 
BABE AMA NT A, 就 可 以 克服 这 个 困难 . 

调查 者 或 许 没有 耐心 ,而且 不 能 理解 统计 学 者 的 愿望 是 要 了 解 调查 者 的 问题 
和 他 所 得 的 数据 的 性 质 , 因为 这 些 是 统计 学 者 选择 使 用 统计 技术 的 惟一 依据 . 这 
时 ， 和， 调 自 己 认为 自己 患 了 某 种 
疾病 让 医生 给 他 开 处 方 .一 个 统计 学 者 , 不 做 任何 进一步 的 考察 而 直接 对 给 出 的 
数据 进行 统计 分 析 ， HE DEERE OR, t Ri TER. 

与 调 信 者 对 活 以 后 , 统计 学 者 将 面临 男 一 个 严重 问题 . 交 到 统计 学 者 手中 的 
大 量 的 数据 是 按照 调查 者 的 特殊 汕 计 所 产生 的 ,而且 没 有 记录 误差 .果真 如 此 吗 ? 
统计 学 者 由 给 定 的 数据 可 以 验 明 这 一 点 吗 ? 一 个 统计 学 省 如 何 与 数据 交流 呢 ? 

统计 学 者 与 数据 之 问 的 对 话 , 或 者 是 对 数据 的 详 察 , 是 数据 分 析 最 基本 的 部 
分 ,也 是 数据 分 析 最 活 牙 的 部 分 .为 此 目的 还 没有 发 展 出 非常 适用 的 语言 ,要 使 数 
字 与 之 对 活 很 大 程度 上 依赖 于 统计 学 者 本 身 的 技能 . 
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给 定 统计 学 者 的 数据 4 ,有 的 值 与 其 他 值 比 较 直 得 过 大 或 者 过 小 ,也 有 的 值 
是 没有 经 过 适当 的 辨认 面 抄录 下 来 的 等 等 .这 (时 对 照 诛 始 记 或 可 以 解决 这 些 间 题 . 
有 些 情 况 下 相 容 性 检验 也 是 有 用 的 . 涂 此 之 外 , 没有 - 般 的 处 方 . 

我 仅 在 这 里 举 出 一例 . 某 个 统计 学 者 ， E. Mem WERE 
ae - 些 上层 社 会 和 部 落 的 人 类 测 最 学 的 - - 些 数据 .测定 的 10 个 特征 值 中 ， 
有 一 个 是 人 体 的 重量 .- -系列 的 重量 测 重 eaten. 7.6,6.5, 8.1, c, 这 里 以 英 
LOIS. Sm tty e rone DRE 14, 转换 原 测量 值 单位 英 下 为 傍 . 
则 将 上 面 汪 到 的 重 盟 单位 为 英 石 的 测量 值 7.6, 6.5,8. 1,…， 才 为 新 的 熙 量 单 位 
E: 14*7.6= 106.4, 14x6.5=91.0,，14X8.1=113,4,…, 代 蔡 查看 整理 过 的 
数字 , 统计 学 者 认为 应 该 全 大 原始 记录 . 在 杏 看 整个 记 冰 时 ,他 发 现 了 一 个 奇异 
点 , 这 就 是 在 所 有 的 重 基 测 基 值 中 , 小数点 后 的 第 -- :位 上 (十 分 位 ) 完 全 没有 7, 
8, 9 三 个 数字 ! 这 里 一 定 有 什么 问题 . 记录 的 数字 看 起 来 没有 错 , 转换 后 的 数字 
看 起 来 也 没有 问题 . 如 果 不 查 看 原始 记录 , 将 不 会 发 现 这 个 错误 .调查 的 结果 发 
现 , 测量 所 使 用 的 蜂 国 制造 的 体重 计 标 度 盘 以 英 石 为 单位 , 在 英 石 与 英 石 之 间 以 
6 个 小 标记 来 表示 了 个 子 划分 -测量 体重 的 调查 者 在 起 束 是 先 记录 英 厂 数 ， 然 后 直 
接 在 小 数 点 第 一 位 上 记录 了 显示 在 标记 盘 下 的 子 划分 的 数 宁 ,这 里 ,居然 把 伟大 
的 印度 人 发 明 的 十进制 位 法 用 错 了 ! 因 调 ， 止 确 的 转换 为 磅 的 方法 是 14x 7 
(6/7) x 14 — 110, MPE 106.4. 册 二 统计 学 者 的 机 第 ,避免 了 二 加 防 人 平均 4 到 
5 磅 的 重 展 的 损失 ,( 没 有 任何 营养 补充 1) 

一 个 统计 学 者 有 时 不 得 不 做 一 个 侦探 , 利用 自己 的 想像 力 去 不 断 追 寻 有 可 能 
与 隐藏 的 神秘 有 关 的 极 少 的 线索 和 提示 .他 应 该 苯 循 这 样 的 格言 : 

除非 验 明 清 自 ,否则 每 一 个 数字 都 是 有 罪 的 、 
5.2.18 ”Rh(Rhesus] 因 子 : 科学 的 调查 研究 


这 里 要 讲 的 是 ,被 称 为 Rh 型 血液 系统 的 遗传 结构 ,如 何在 短 时 间 内 被 -群英 
鲸 研究 学 者 们 发 现 的 故事 . Rh 因子 是 列 文 {Levin)1939 年 在 一 例 死 胎 的 情形 中 发 
现 的 ,其 母亲 的 撑 清 中 发 现 了 一 种 抗体 A( 或 称 为 反 D) , 这 是 由 美国 白人 献血 者 血 
液 的 85% 胶 着 而 生成 的 .这 个 结果 所 示 了 ,双方 中 有 一 方 存在 -种 能 产生 抗原 了 
的 对 立 遗 传 因子 的 门 德尔 因子 . 长 话 短 说 ,此 后 一 个 接 一 个 的 发 现 了 抗体 Y OS 
c). Bü PO C), HOS E), 这 些 是 由 + 或 -的 不 同 的 反应 组 合 产 生 的 .由 这 些 抗 
Mk, 至少 可 以 识别 7 个 不 同 的 对 立 的 遗传 因子 (或 者 是 小 传 复合 体 ). 具 有 这 7 个 
遗传 因子 复合 体 对 抗体 y, TAA HE BURO TES 5.5 中 的 第 一 栏 , RR 





























D KA (stone) ARH BAM, 1 H = 14 Ib — 6.35029 kg. 一 一 泽 者 注 
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R, R, R’, R, 
由 了 个 遗传 因子 对 yY, D, AFH, 雷 斯 (Race, 1944) 做 了 如 下 评价 和 预期 . 


表 5.5 ?个 遗传 因子 复合 体 对 已 知 的 4 个 抗体 的 反应 和 预测 











BERAT 已 知 的 抗体 | 预测 的 抗 休 预测 的 遗传 
Baw YTAH .| HFEA 

RI -++- 一 + CDe 

R +- ++ -- DE 

r + 一 一 t4 cde 

Ry bo - + cDe 

R" + + 1 | cdE 

n 1 - i ++ Cde 

R +++ | mE CDE 

XR Teo + +- aE 











* HOMES, WA ee FRO. 


了 个 遗传 因子 的 复合 体 中 , 没有 :个 对 yY 和 工 有 同样 的 反应 .因此 , y 和 T 是 
对 立 的 抗体 . 极 有 可 能 的 是 这 样 的 对 立 的 抗体 对 A 和 H 也 存在 ,作为 预期 分 别 记 
PELIS 

可 能 还 有 -个 遗传 因子 复合 体 , RIEN R, 它 对 4 个 抗体 的 反应 列 在 表 
5.5 的 最 下 一 行 .这 样 就 形成 了 “个 完整 的 系统 ,每 一 种 试剂 (抗体 )， 对 4 种 遗传 
因子 复合 体 反 庶 为 止 , 对 甚 余 4 种 的 反应 为 负 . 

这 些 猜测 出 现 后 不 到 一 年 ,疾苦 特 (Mourant，1945) 就 发 现 了 抗体 9, 辐 一 第 
STE (Diamon) KH T GU è. 

XY, BHC 1947 RMT H 3 TAC, c), (D, DAE, e) dak 
对 立 的 遗传 因子 与 密切 相 联 系 的 3 P 1 RT PE eS RC D EE 
质 . 山 于 遗传 因子 C,D 和 下 的 存在 ,产生 对 抗体 FF,A 和 HH 的 反应 分 别 为 正 , 而 遗 
传 内 子 c, d 和 c 的 仓 在 产生 对 抗体 Y, 8 和 了 的 反 点 分 别 为 正 . 

今 大 我 们 所 知道 的 遗传 结构 更 复杂 了 ,3 个 位 置 的 每 一 个 上 面 分 别 有 两 个 以 
上 的 对 立 的 遗传 因子 . 然而 , 比 起 Rh 因子 发 现 初期 的 混乱 和 含糊 来 说 , 经 仔细 组 
织 的 调查 研究 对 系统 收集 数据 握 供 了 迅速 而 有 效 的 分 析 . 


5.2.19 ”家 庭 人 口 .出 生 顺 序 和 智商 1.Q. 


过 去 20 第 中 ,人 们 对 中 学 高 年 级 学 生 的 平均 SAT( 学 业 才 能 测试 ) 成 绩 降 低 
已 经 有 “一些 研究 .为 六 解释 这 个 现象 ,在 一 些 国 家 收集 了 子女 SAT 成 绩 以 及 可 能 
与 之 相关 的 父母 的 职业 ,家 庭 人 数 和 出 后 顺序 等 数据 .下面 表 5.6 和 表 5.7 给 出 了 
两 个 相关 人 饶 究 的 数据 . 
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表 5.6 和 表 5.7 的 数据 表明 成 绩 随 家 庭 人 数 的 增加 一 舱 在 降低 ( 表 5.7 中 家 
庭 仅 有 一 人 的 情形 例外 ) 而 划 成 绩 随 出 后 顺序 的 增加 而 降低 (表明 后 出 生 的 不 如 先 


出 生 的 联 明 ). 


有 争议 的 是 , 比 起 早出 生 的 来 说 ,是 否 后 出 生 的 -了 女 是 在 较 低 智商 的 环境 中 成 
长 的 ,这 里 考虑 的 智商 环境 是 父母 与 较 早出 生子 女 知 商 水 平 的 平均 值 . 叮 以 认可 


的 一 种 情形 基 随 着 增加 子女 间 年 龄 的 间隔 








其 影响 是 可 以 逆转 的 ,因此 仅 取决 于 年 


龄 来 判断 智商 水 平 将 使 得 早出 生 的 子女 高 于 晚 出 生 的 子女 的 好 几 售 . 
表 5.6 英国 家 庭 人 口中 按 子 女人 数 分 类 计算 的 于 女 平均 智商 IQ。 








家 庭 子 女人 数 智商 L.Q. 抽取 家 庭 样本 数 
1 106.2 115 
2 105.4 212 
3 102.3 185 
4 101.5 152 
5 99.6 127 
6 96.5 103 
7 93.8 88 
7+ 95.8 102 











ST 1965 年 美国 国家 奖学金 资格 测试 按 索 庭 人 口 排序 的 平均 数 

















BEE 
REAN — 
1 2 3 4 5 
1 103.76 ] ° 
2 106.21 104.44 
3 106.14 102.89 102.71 
4 105.59 103.05 101.30 100.18 
5 104.39 101.71 99,37 97.69 96.87 
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努力 把 科学 知识 传播 给 大 众 .先进 国 
个 问题 并 制定 方针 政策 来 达到 这 个 
的 杂志 , 称 为 “科学 和 公众 


WA 


第 6 章 ”统计 学 的 公众 理解 一 一 从 数字 开始 学 习 


AB, 是 从 不 充分 的 证 据 开 始 引出 完美 结论 的 一 种 艺术 . 
ZB r ER H (Samuel Buiter) 


要 理解 神 的 旨意 , 我们 必须 学 习 统 计 学 , 这 是 因为 统计 是 神 的 意图 
的 量度 . 
A BS W T HA (Francis Nightingale) 


6.1 大众 的 科学 


TRA. D. Bernal) 在 1939 年 出 版 的 《科学 的 社会 作用 》-- 书 中 写 到 : 


各 果 我 们 不 与 比 同时 认识 到 真正 的 理解 科学 已 成 为 我 们 当今 日 常生 
活 的 一 部 分 ,那么 仅仅 促使 科学 家 们 认识 相互 的 工作 是 毫 无 意义 的 . 





仅仅 半 个 世纪 以 后 ， 人们 就 认识 到 了 中 尔 纳 所 说 的 事实 的 重要 性 ,并且 认 真 
家 的 国家 科学 院 设 有 专门 的 委员 会 来 研讨 这 
的 .5 年 以 前 , 英国 皇家 学 会 创办 了 一 份 新 








PS”, 其 宗旨 就 是 把 科学 知识 传播 到 大 众 , 解释 与 日 
活 有 关 的 科学 和 技术 发 现 的 蕴涵 - 皇家 学 会 的 新 口号 是 : 


科学 是 为 每 一 个 人 的 - 





的 4 


的 发 现 可 能 对 社会 和 环 麻 产 生 有 害 影 响 的 结果 .更 进一步 ， 人 们 应 该 认识 到 
务 地 政府 的 政策 , 如 修建 核电 三 将 对 他 们 和 他 们 的 子女 的 生活 产 牛 如 何 的 影响 . 


EK 





中 发 挥 作用 .他 们 也 必须 了 解 - - 些 企业 家 为 了 白 身 的 利益 无 视 探 索 新 





当 贝 尔 纳 写 他 的 这 本 书 时 ， 人们 还 没有 认识 到 统计 学 是 一 门 独立 的 学 科 . 


仅 是 从 20 (itf Eo op, 大 们 才 认 识 到 统计 学 的 重要 性 , 它 是 从 观测 数据 中 获 


取 有 











信息 的 一 -种 方法 ,也 是 在 不 确定 性 下 做 出 决策 的 逻辑 .因此 ,统计 学 的 知识 


对 人 的 整个 一 生 都 是 有 价值 的 财富 .要 是 贝尔 纳 活 到 今天 ,并 认识 到 统计 学 的 普 
遍 存 在 ,他 一 定 会 在 带 给 我 们 《科学 的 社会 作用 》 的 最 新 版 里 加 于 :与 其 他 任何 科学 
领域 相 比 , 社会 公众 对 统计 学 的 理解 是 极为 重要 的 . 





SA, 科学 几乎 渗透 了 我 们 现实 社会 的 每 一 个 方面 , 社会 公众 理解 科学 


的 重要 性 是 无 需 强 调 的 .社会 公众 必须 知道 , 一 种 新 的 技术 如 何 能 够 在 提高 他 们 


世界 
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6.2 数据、 信息 和 知识 


一 个 确定 的 事物 的 惟一 的 麻烦 是 它 所 含 的 不 确定 性 . 
什么 是 统计 学 ? TREE RA ER EEA 它 是 一 门 像 数 党、 物理 .化 
学 和 生物 学 那样 有 确切 定义 的 独立 的 研究 学 科 吗 ? 统计 学 中 我 们 研究 的 现象 是 什 
A? 
统计 学 没有 任何 固有 的 对 象 , 是 一 门 独特 的 学 问 .统计 学 由 解决 其 他 领域 内 
的 问题 而 存在 并 兴 时 发 达 . 按 萨 维 奇 (L.J，Savage) 的 说 法 : 


统计 学 基本 上 是 寄生 的 : 靠 研究 其 他 领域 内 的 工作 而 生存 .这 不 是 
对 统计 学 表示 轻视 , 这 是 因为 对 很 多 寄主 来 说 ， 如 果 没 有 寄生 虫 就 会 
死 .对 有 的 动物 来 说 ， 如 果 没 有 寄生 里 就 不 能 消化 它们 的 食物 .因此 ,人 
类 奋斗 的 很 多 领域 ， 如 果 没 有 统计 学 ， 虽 然 不 会 死亡 , 但 一 定 会 变 得 很 
A. 


DUX 20 世纪 开始 ,统计 学 已 成 为 大 学 里 讲授 的 课程 .但 是, 即便 如 此 , 统计 学 在 科 
学 和 社会 学 中 的 作用 仍然 没有 得 到 大 众 和 专业 人 员 的 很 好 的 理解 . 

RAAM, 人们 对 统计 学 的 误解 与 怀疑 可 表现 为 如 下 几 点 : 

* 谎言 ,该死 的 谎言 与 统计 . 

* 统计 不 能 用 来 代替 判断 力 . 

* 我 已 知 答案 ,请 给 我 统计 事实 去 证 实 . 

* 利用 统计 学 ,可 以 证 明 - - 切 事物 . 

统计 也 是 被 嘲笑 的 对 象 ， 例如 : 

* 统计 犹如 比基尼 游泳 衣 . 它 暴露 的 是 明显 的 地 方 , 而 谴 盖 住 最 重要 的 . 

SR, 统计 已 经 变 成 一 个 魔术 一 般 的 词汇 ， 它 能 给 我 们 想 说 的 话 披 上 现实 的 
DE 




















统计 数据 让 明了 抽烟 对 健康 是 有 害 的 ， 
出 统计 可 知 : 不 结婚 的 男性 会 中 逝 10 46. 
由 统计 的 观点 : 身材 高 的 父母 有 较 高 身材 的 子女 . 
统计 调查 表明 ， 岗 大 服 一 片 风 斯 此 林 会 减少 心脏 病 第 二 次 发 作 的 机 会 . 
* 有 统计 证 据 证 实 , 第 二 个 出 生 的 子女 没有 第 … 个 聪明 ,第 三 个 出 牛 的 子女 
没有 第 二 个 聪明 ,以 此 类 推 . 
* 由 统计 确认 ,如 果 每 天 摄取 500 毫升 的 维生素 C, 生命 可 以 延长 6 年 . 
* 统计 调查 表明 , 怕 老 婆 的 丈 大 得 心脏 病 的 机 会 较 大 . 
* 有 统计 实验 证 实 , 学 和牛 们 在 听 了 莫扎特 钢琴 曲 10 分 钟 后 的 推理 测试 会 比 
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Ai AT Ir. 上 分 钟 娱 乐 碟 带 或 其 他 则 月 做 得 更 好 . 

统计 学 作为 学 术 和 研究 的 一 个 领域 ,历史 比较 短 浅 , 供 必 为 数值 信息 的 历史 
却 很 您 久 . 现 保存 下 来 的 古代 的 资料 中 , 有 国家 (states) 以 及 它们 的 资源 和 国民 的 
物 成 的 数据 信息 .这 说 明了 统计 学 (statistics) 一 词 的 词根 来 自 国家 (state) 的 事实 . 
有 关 古 代 人 LT 和 农业 的 社会 调查 统计 的 参考 文献 今天 我 们 已 知 的 有 : 中 国 的 《 管 
子 》( 公 元 前 1000 年 ),《 旧 约 书 3 公元 前 1500 年 ) 和 卡尔 特 亚 的 《印度 经 典 》( 公 元 
前 300 4E). 

早期 的 -个 有 关 统 计 记录 的 例子 , 是 在 据 今 50 个 世纪 以 前 (公元 前 3000 4E) 
的 一 个 埃及 上 的 王家 权 杖 上 的 数字 中 发 现 的 .在 与 另 一 个 国王 交战 以 后 , 权 械 上 记 
载 了 凯旋 的 国 二 军队 所 缴获 的 
战争 俘虏 120 000 人 
牛 40 000 3k- 
山羊 1 422 000 头 
这 些 源 亮 的 四 舍 五 人 的 整数 是 如 何 得 色 的 ? 是 国 七 的 管理 人 实际 数 过 的 ,还 是 打 
了 胜仗 的 国 干 自己 想像 的 虚构 的 数字 ? 或 者 是 为 了 强调 成 利 品 的 量 大 而 凑 成 整数 
的 ? SEB - ARA (Samuel Johnson) 相 信 : 

四 会 五 入 的 整数 永远 是 有 误 的. 


这 - - 定 是 16 世纪 德国 物理 学 家 威尔士 (Weirus) 所 预料 到 的 , SEA IE RAE C 
欧洲 人 正 对 疾病 和 丙 女 怀 着 恐惧 .威尔士 计算 了 地 球 上 正好 居住 了 7 405 926 4-88 
R! 因为 威尔士 是 有 文化 的 人 , 所 以 大 多 数 人 相信 这 个 数字 .一定 是 经 过 他 实际 数 
过 的 . 

我 记得 在 美国 填写 纳税 申报 表 时 ，, 在 《税金 指南 》 中 有 这 样 的 忠告 ; 


经 过 对 GAO(General Acounting Office， 国 会 会 计 室 ) 报 告 的 仔细 审 
查 , 确 认 了 一 个 二 要 的 方法 可 以 减少 核查 时 的 麻烦 .这 就 是 ， 当 要 报告 收 
入 或 支出 的 额度 时 ， 避 和 免 使 用 取舍 整数 ,如 $100，$250，8$400 和 
$600 这 样 的 数字 容易 引起 审计 官 的 怀疑 ,而 8$171，$313，$ 496 这 样 
的 就 不 容易 引起 怀疑 , 因此 ,和 如果 不 得 不 估计 某 些 支出 时 , 最 好 估计 成 
AK. 


SE ETRE PE MAE OX Ede BR”. 数据 传达 什么 呢 ? 为 了 一 个 
特定 的 目的 我 们 如 何 利用 数据 呢 ? 为 此 , 我 们 必须 知道 在 解决 一 个 给 定 的 问题 
时 , 从 观测 的 数据 中 可 以 获得 什么 样 的 信息 ?可 以 获得 多 少 信息 ? 什么 是 信息 ? 
RIF, 最 逻辑 性 的 定义 是 由 信息 论 的 专家 香农 (C.Shannon) 给 出 的 “不 确定 性 的 
SE? ,这 是 解决 问题 的 关键 .数据 本身 不 是 问题 的 解答 .但 是 对 我 们 以 什么 样 的 程 
上 度 来 图 满 由 符 问题 , 以 及 在 一 个 特 处 的 答案 中 含有 多 大 程度 的 不 确定 性 , 或 者 对 
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答案 的 信赖 程度 有 多 大 这 些 问题 的 考虑 来 说 , 数据 是 基本 的 资料 .人 们 需要 对 所 
观测 的 数据 进行 处 理 ,以 便 确定 所 能 解决 的 不 确定 性 程度 , 出 数据 所 提供 的 不 确 
定性 量度 的 知识 是 做 出 正确 决策 的 关键 . 并 旦 能 够 使 我 们 权衡 各 种 选择 的 结果 , 选 
出 一 个 风险 最 小 的 .今天 所 理解 的 统计 学 是 一 种 逻辑 , 由 此 使 我 们 能 像 攀登 梯子 
一 样 从 数据 攀登 到 信息 . 

当 信息 逐渐 增多 时 ,不 确定 作 逐 渐 减 少 到 一 个 可 接受 的 最 低 水 平 , 使 我 们 能 
登 上 数 段 阶梯 达到 知识 的 水 准 , 基 上 这 种 认 知 使 我 们 能 够 信赖 所 采取 的 行动 (有 不 
可 避免 的 很 小 的 危险 ) .这 种 情形 下 的 知识 并 不 是 所 有 领域 内 的 所 有 情形 下 都 能 达 
到 的 .这 里 所 表明 的 旦 在 与 给 定数 据 相 关 的 不 确定 作 的 情形 下 做 内 决 策 时 ,统计 学 
作为 一 种 方法 沦 的 必 览 性 . 

按照 著名 科学 家 拉 : 罗 盆 (R. Roy) 的 说 法 , 拟 合 知识 中 可 接受 的 部 分 和 扩大 知 
识 范围 的 知识 就 构成 智慧 ,这 种 智慧 是 上 面 提 到 的 认 知 中 的 一 步 阶梯 .如 十 言 : 











又 是 错误 
但 是 在 减少 
不 断 减少 
FR ALY | 


6.3 信息 革命 与 统计 学 的 理解 


像 今 天 有 能 力 的 公民 能 读 会 写 一 样 ， 将 来 会 有 一 天 要 求 有 能 力 的 公 

民 必 须 会 计算 ， 而 且 能 够 利用 平均 值 .最 大 值 和 最 小 值 .可 以 预期 ， 这 样 
的 时 代 已 经 不 远 了 ， 

威 尔 斯 (H.G- Wells) 


人 类 的 繁荣 , 过 去 依赖 于 农业 革命 , 后来， 又 依赖 于 工业 革命 .但 是 ,这 些 都 
没有 缓和 人 类 饥饿 和 疾病 的 痛苦 . 这 里 主要 的 障碍 是 我 们 没有 能 力 去 顶 测 将 来 ， 
并 做 出 英明 的 决策 . 健全 的 政策 依靠 准确 可 靠 的 信息 . 因此 ,为 了 减少 不 确定 人 以 
便 能 做 出 较 好 的 决策 , 有 必要 扩 天 数据 信息 基础 . 

现在 已 经 广泛 认识 到 作为 设计 和 执行 一 个 课 愿 的 关键 部 分 , 信息 的 重要 性 已 
经 大 于 技术 上 的 专家 了 .我 们 正 处 十 信息 革命 的 时 代 , 无 论 国营 的 或 是 私营 的 企 
业 都 进行 了 很 大 的 投资 去 收集 和 处 理 信息 .据说 , 美国 公 、 私 企业 的 雇员 中 ,， 有 
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40% 到 50% 是 专门 做 这 些 工 作 的 . 

统计 学 对 大 众 的 必 变 性， 从 报纸 提供 相当 的 篇 幅 米 传播 各 种 信息 的 事实 可 以 
得 到 验证 .在 计划 户外 活动 时 , 我 们 可以 得 到 约 一 岗 时 间 的 详细 大 气 预报 . 各 种 股 
票 市 场 价格 的 信息, 告诉 我 们 什么 样 的 投资 可 以 获 利 .关于 体育 的 特别 栏 日 使 我 
们 可 以 了 解 批 界 各 弛 的 体育 消息 . 在 如 拿 大 埃 德 蒙 顿 出 版 的 日 报 甚至 每 大 刊登 称 
为 每 日 蚊子 指数 的 信息 ,以 便 让 公众 了 解 市 政府 有 关 部 门 为 了 使 公众 满意 尽力 采 
取 措 施 以 控制 城市 的 蚊子 .纽约 时 报 几 乎 以 3096 的 篇 幅 刊登 各 种 统计 资料 以 及 基 
于 这 些 资料 的 有 关 报告 - 

有 很 多 像 消 费 者 报告 之 类 的 杂志 , 给 公众 通告 市 场 中 商品 的 价格 并 比较 各 种 
产品 的 性 能 . 

理 鲜 统 计 学 的 二 要件 有 儿 个 阶段 . 首先 是 针对 个 体 对 每 个 人 市 言 的 .众所周知 
的 是 了 解 二 R(Reading，wRiting，aRithmetic, i£, 写 , 算 ) 的 需要 .但 是 , 这 些 对 
每 一 个 人 一 生 中 所 面临 的 需要 克服 的 不 确定 性 来 说 是 不 够 的 , 每 个 人 , 在 他 上 大 
学 结婚 ,投资 以 及 处 理 每 天 工作 中 的 问题 时 ,都 必须 做 出 各 种 决策 .这 就 要 求 另 
一 种 不 同 的 技能 ,我 们 可 称 为 第 四 个 R(statistical Reasoning, 统计 推断 ), 这 就 是 
要 了 解 自然 界 和 大 类 行为 中 的 不 确定 性 , 在 利用 自己 和 他 人 的 经 验 做 出 决策 时 能 
使 风险 最 小 化 .更 进一步 , 统计 知识 是 个 人 的 一 笔 财 窜 , 可 以 保护 自己 和 家 人 不 受 
传染 病 的 影响 ， 防 范 政 治 家 的 宣传 和 商人 夸大 事实 的 广告 ,摆脱 掉 比 疾病 还 糟 的 
迷信 , 有 效 地 利用 天 气 预报 ,了解 各 种 灾害 ， 如 核电 厂 的 放射 线 油 兴 以 及 影响 生 
活 的 其 他 自己 不 能 控制 的 方面 . 

对 一 般 人 来 说 , 要 获得 第 四 个 R,， 需要 对 统计 学 进行 特别 的 学 习 吗 ? 回答 是 
RMB RE, 与 算术 一 起 实施 一 定量 的 统计 学 教育 就 足够 了 .我 们 的 学 校 教 
育 系统 更 多 的 是 鼓励 学 生 相 信 生 好 的 东西 ,象征 性 地 用 谱 滞 中 所 说 的 “在 小 鸡 没 
锋 出 来 之 前 , 不 要 算计 它们 "来 警告 他 们 不 要 做 有 风险 移行 为 ,而 不 是 让 他 们 做 好 
在 变化 浴 界 中 后 活 的 准备 , 以 及 如 何 面临 现代 生活 中 国难 的 情形 . 

我 们 必须 学 习 如 何 计算 风险 . 最 近 有 一 则 报道 ， 华 盛 顿 越南 退伍 军人 纪念 碑 
上 雕刻 的 姓名 中 至 少 有 38 ARRIKA. 当 就 这 件 事 淘 问 有 关 责 任 者 时 , 他 说 
到 :~ 当时 由 于 记录 不 充分 , 不 能 肯定 战 死 着 的 姓名 . 也 不 知道 即使 纪念 碑 建成 以 
后 还 可 以 追加 姓名 . 我们 想 的 是 , 如 果 不 包括 这 些 人 ,这些 人 就 会 从 历史 中 消 
失 .” 

其 次 ,理解 统计 学 的 重要 性 足 对 政治 家 或 者 是 制定 政策 的 人 来 说 的 .政府 为 了 
收集 数据 ,有 SHEA TEE BELAY. 这 些 收 集 来 的 数据 被 用 来 制定 在 日 常 行政 工 - 
作 以 及 为 补 会 福利 制定 长 期 计划 中 的 止 确 的 政策 .政策 制定 者 在 做 出 决策 时 ,期 单 
寻求 技术 指导 .然而 ,重要 的 是 他 们 委 己 在 了 解 和 解释 信息 时 需要 掌握 某 些 专业 
技术 知 误 .下 面 的 趣闻 便 说 明了 这 个 事实 . 
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在 政府 和 工业 部 门 中 工作 的 统计 学 者 们 常常 与 他 们 的 上 司 产生 语言 
上 的 障碍 .一 个 统计 办 公 室 的 主管 也 是 一 个 行政 事务 官 ,一 次 与 一 些 统计 
学 者 开会 ， 统 计 学 者 抱 怒 从 其 他 部 门 收 到 的 一 些 估计 值 没有 给 出 标准 误 
差 ,标准 误差 是 估计 值 所 附带 的 一 个 数 ， 表 示人 居 计时 误差 的 大 小 ,给 出 
估计 的 精度 . ] 这 个 主管 马上 问 道 ;对 误差 也 有 标准 吗 "? 

一 个 统计 顾问 提交 给 茶叶 委员 会 的 报告 中 ， 含有 标题 为 :" 饮 茶 人 数 
的 估计 值 ( 含 标准 误差 )" 的 附 表 . BA, 一 封 信 被 送 到 这 个 统计 学 者 手 
P, 问 到 什么 是 人 们 喝 红 茶 时 所 需要 的 “标准 误差 ”. 
皇家 委员 会 审查 一 份 统计 报告 ,报告 中 提 到 中 产 阶级 家 庭 平均 有 2.2 个 子 

女 . 委 员 会 评述 说 : 

每 一 个 成 人 女性 有 2.2 个 子女 的 数字 是 荡 汤 的 .这 是 为 了 要 求 对 中 
产 阶级 提供 财政 援助 以 便 通 过 四 舍 五 入 把 平均 值 提高 到 一 个 更 合适 的 整 
&. 


健康 大 臣 对 一 个 统计 学 者 的 报告 中 提 公 的 大 年 由 于 某 种 疾病 , 平均 1000 人 
中 死亡 人 数 为 3.2 这 个 数字 发 生 了 兴趣 . 他 问 他 的 私人 秘书 ， 个 行政 官 ，3.2 个 
人 是 如 何 死 法 ? 他 的 秘 [SUL 
先生 ， 当 一 个 统计 学 家 说 死 了 3.2 PA, 意味 着 3 个 人 已 经 死 了 ， 
两 个 人 正 要 死 . 
政府 的 政策 决策 是 非常 重要 的 ,会 影响 儿 六 万 人 . 为 此 ,他 们 需要 正确 的 信 
B. ,同时 需要 处 理 信 息 的 王 确 的 方法 ， 


最 后 ,对 医学 .经 济 学 .科学 和 技术 中 的 某 些 专 家 来 说 , 数据 的 解释 和 分 析 是 
他 们 研究 工作 中 不 可 或 缺 的 部 分 . 


6.4 令 人 悲哀 的 数字 


不 要 告诉 我 那些 契 衣 的 数字 ， 
人 生 不 过 是 一 场 空 梦 . 
B3 & (H.W. Longfellow) 

今天 , 通过 报纸 .杂志 和 共 他 新 闻 媒 介 , 我 们 已 经 能 不 断 地 认识 到 我 们 的 饮 
食 习 惯 \ 运 动 . 吸 烟 和 饮酒 的 习惯 ,以太 在 工作 单位 和 其 他 日 常 活动 中 所 受到 的 压 
力 对 我 们 好 坏 两 方面 的 影响 . 这 些 信息 ,常常 用 带 有 单位 的 损失 或 增益 的 数值 来 
表示 . 下面, 从 Cohen 和 Lee(1979) 的 文章 中 我 们 抄录 了 一 些 翡 究 的 数字 . 

我 们 如 何 解释 这 些 数字 呢 ? 这 些 数字 传达 的 是 什么 信息 ? 个 人 如 何 利用 这 些 
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数据 形成 自己 的 牛 活 模 式 来 增加 幸福 呢 ? (参见 表 6.1.) 
首先 考虑 表 6.1 中 的 第 一 个 数字 , 即 未 婚 男性 平均 寿命 的 损失 . 这 个 数字 通 
常 可 以 由 死亡 记录 中 有 关 死 者 的 性 别 、. 婚 姻 状 态 和 年 龄 的 信息 中 得 到 .在 男性 的 死 
亡 记录 中 ,只 须 分 别 对 已 婚 和 未 婚 的 简单 地 计算 平均 死亡 年 龄 . 这 些 平均 数字 的 
差 为 3500 天 .这 个 结 灯 可 能 给 未 婚 者 一 个 危险 的 信号 , 说 明 结婚 的 惯例 是 好 的 ， 
而 且 对 某 些 人 的 早 结婚 可 大 约 延 长 10 年 寿命 的 建议 提供 了 一个 强 有 力 的 根据 ! 
然而 , 这 里 并 不 意味 着 这 个 原因 (结婚 ) 和 和 结果 (延长 10 年 寿命 ) 的 关系 适用 于 每 
-个 人 .十 分 可 能 的 是 , 对 某 个 人 来 说 ,结婚 就 意味 着 是 自杀 ! 毫 无 疑问 , 如 果 按 
赂 男性 的 个 人 特征 进行 分 组 所 做 的 死亡 记录 , 会 得 到 有 更 多 信息 的 更 好 的 列表 结 
果 . 一 般 来 说 , 不 同 的 组 寿命 的 长 短 也 不 同 .每 个 人 可 根据 自己 的 特征 , 参照 与 自 
己 的 特征 相似 的 分 组 的 数字 进行 分 析 ， 


表 6.1 不同 原因 所 引起 的 寿命 损失 























原因 RE 原 因 RR 
Xie Ht) 3500 饮酒 130 
惯用 左手 3285 枪 雹 事故 1 
RAR E) 1600 自然 放射 线 8 
30% 超 重 1300 医疗 X- 射 线 6 
20% 超 重 900 咖啡 6 
吸 香 烟 (男性 ) 2250 口服 各区 药 5 
吸 香 烟 ( 女 性 ) 800 减肥 饮料 2 
dust 330 PAP 检验 -4x 
用 烟斗 抽烟 丝 220 家 里 有 烟 堆 警报 -10 
危险 工作 , 事故 300 带 有 气 垄 的 轿车 -50 
一 般 工 作 , 事故 74 移动 冠状 动脉 监护 器 -125 





* 负数 表示 增加 寿命 . 


从 表 6.1 可 以 看 到 , 惯用 左手 的 人 比 惯用 右手 的 人 少 活 约 9 年 .这 意味 着 惯 
左手 的 人 在 遗传 上 有 什么 问题 吗 ? 避 伯 不 是 吧 : 这 个 差别 或 许 是 由 于 惯用 左手 
的 人 生活 的 这 个 世界 , 即 绝 大 多 数 日 用 品 都 是 为 惯用 右手 的 人 的 方便 而 生产 的 不 
利 因素 所 造成 的 .但 是 , 统计 信息 对 那些 惯用 左手 的 人 是 有 用 的 ,保护 自己 免 遭 可 
能 的 危险 . 

一 般 说 来 ,平均 值 是 把 个 体 组 成 的 集合 (总 体 ) 视 为 整体 的 一 个 慨 括 特征 的 措 
标 , 可 用 于 比较 各 个 不 同 的 总 体 .我 们 可 以 说 , 平均 月 收 人 1000 美元 个 体 组 成 的 
总 体 比 平均 月 收入 500 美元 个 体 组 成 的 总 体 富裕 .但 是 , 平均 值 对 个 体 之 间 个 人 
收入 的 差别 没有 任何 评价 .例如 , 个 体 的 收入 可 以 在 20 美元 到 100 000 美元 之 间 
变动 ,而 平均 值 为 1000 美元 . … 个 总 体内 , 个体 之 河 收入 的 差别 称 为 变 所 
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(variability) ,也 是 与 总 体 之 间 的 比较 有 关 的 指标 . 绝 大 多 数 情况 下 , 平均 值 和 某 
些 变 异 的 量度 (如 收入 的 范围 ), 可 以 提供 一 些 实际 水 平 的 信息 .平均 值 自身 有 可 
能 是 靠不住 的 , 因而 在 对 个 体 进行 判断 时 ,并 不 总 是 有 用 .可 以 想像 一 下 , 如 果 让 
一 个 不 会 游泳 的 人 涉 过 一 条 平均 深度 浅 于 他 的 身高 的 河 ,会 是 什么 情形 ! 























6.5 天 气 预 报 


可 信和 闲 的 天 气 预报 员 将 他 们 的 麦克 克 移 近 窗 户 ,从 而 决定 是 否 采用 

官方 的 预报 或 是 根据 他 自己 对 窗户 外 情形 的 判断 来 预报 . 

LEAN, 天 气 预报 用 的 是 得 统 的 表达 形式 , 诸如 : 明日 有 雨 , 明日 可 能 有 
十 , 明 H 不 会 降 闪 等 等 .天 气 询 报 经 常 出 错 .今天 ,天 气 预报 采用 了 不 同 的 形式 : 
明日 有 十 的 可 能 性 为 60% .这 个 60% 意 味 什么 ? 这 样 的 现 报 比 起 早期 的 预报 形式 
来 说 包含 更 多 信息 吗 ? 或 许 , 对 那些 完全 不 知道 “可 能 性 ”代表 什么 的 人 来 说 , 今 
天 的 预报 会 引起 混乱 , 甚至 会 产生 今天 的 预报 不 如 过 上 友 准 确 或 是 不 如 过 去 有 用 的 
PR. 

大 气 预报 中 , TEBRA RHE AK. Aii, MOB COEUE, 没有 给 出 
预测 精度 的 预报 ， 对 次 策 来 说 是 毫 无 意义 或 者 是 没有 用 的 . 天气 预报 中 ,60% 这 个 
数字 提供 了 预测 精度 的 一 个 量度 .做 出 这 样 的 预报 时 ,常常 意味 的 是 明天 有 6096 
可 能 性 会 降雨 . 当然 , 不 可 能 断言 某 -特定 的 时 刻 会 降 南 . 在 这 个 意义 下 , 预报 
“明日 有 雨 的 可 能 性 为 60% EAM, 比 起 “明日 有 十 "的 笼统 说 法 来 说 更 有 罗 辑 
性 .那么 , 在 什么 意义 下 这 个 叙述 是 有 用 的 呢 ? 

假设 基于 天 气 预报 “明日 有 两 的 中 能 性 为 60% "的 情形 下 要 决定 是 否 带 企 , HE 
假设 无 论 哪 -- 天 , 由 于 带 伞 所 引起 的 不 便 能 用 钱 来 量度 , 设 为 m 美元 , 而 由 丁 没 
有 带 伞 被 淋 湿 了 的 损失 设 为 + 美元 . 则 当 降 雨 的 串 能 性 为 60% 时 ,以 美元 的 形式 
求 出 两 种 决策 下 所 期 望 的 损失 为 
决策 ”期望 的 损失 | 















































die 
不 带 个 0.6xr+0.4x0 = 0.6r 
Wi, 34 m0. 6r, RERE, m > 0. 6r 时 不 带 伞 可 以 最 小 化 你 的 损失 . 
这 是 一 个 简单 的 例证 ， 说 明 如 何 利用 预报 量度 的 准确 与 否 ,来 加 权 处 理 不 同 
的 可 能 的 决策 下 所 产生 的 结果 ,从 市 选择 最 佳 的 . 如果 在 预报 中 , 没有 指定 不 确 
定性 的 量度 , 就 没有 基础 去 做 出 - -个 决策 . 
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6.6 社会 与 论调 查 


PARTERO, RGR TR. 
奥斯卡 - 列 文 托 (Oscar Levant) 
过 去 ,当权 者 们 利用 侦探 系 统 来 查 明 公众 的 观点 .或 许 , 由 此 所 收集 的 信息 
帮助 他 们 形成 公众 政策 ， 制 定 和 实施 法 律 . 吉 代 的 社会 与 论调 查 的 历史 , 是 由 盖 
洛 普 民 意 调 查 的 第 一 个 报告 开始 的 .今天 , 社会 导论 调查 在 报纸 和 其 他 新 闻 媒 介 
中 已经 扮演 了 -- 个 主要 的 角色 . 他 们 收集 公众 对 各 种 社会 .政治 和 经 济 问题 上 的 信 
息 , 出 版 摘要 报告 .这 样 的 奥 论 调查 在 民主 政治 社会 中 能 起 到 积极 的 作用 .他 们 可 
VPA RAVE TIT AAR, 什么 是 公众 的 爱好 . 他 们 也 向 公 
众 报告 新 闻 ， 通告 公众 的 想法 ,或 许 串 帮 助 在 某 个 重要 的 问题 上 明确 表现 公众 的 
WA. 
SE A AAR EYEE CUR S RSLS DALE 8 R BE eB. 
例如 , 播音 员 涪 : 
MORS ORG AL 12%, 正 负 误 差 界 限 为 4%. 


代 赫 给 出 单个 数字 , xx HUE DL HI MIX] (42-4, 42+4) = (38, 46). 
这 是 如 何 得 到 的 ? 如 何 解释 呢 ? 

假设 所 有 美国 成 人 中 , 实际 竺 成 总 统 外 交 政 策 的 比率 为 数值 .为 了 了 解 芽 
的 大 小 , 必须 接触 每 一 个 美国 成 人 , 得 到 他 们 对 ”你 赞成 总 统 的 外 交 政 策 吗 ?这 
样 问题 的 反应 . 如果 必须 要 得 到 一 个 限时 的 ,迅速 的 答案 , 这 是 不 可 能 的 .最 好 的 
方法 是 求 出 -个 最 接近 十 工 的 估计 值 .新 闻 媒 介 对 某 一 数量 的 “任意 选择 的 个 体 ” 
进行 电话 采访 , 得 到 他 们 的 答案 . 如 果 接 触 了 数量 为 p 的 个 体 , 其 中 有 上 个 人 回 
SH ALY, 则 工 的 估计 值 可 为 100 x (rp). 当然 , 这 样 的 估计 是 存在 一 定 的 误差 
的 ,因为 我 们 所 取 的 仅仅 是 基 个 集合 中 的 样本 (美国 成 人 中 很 小 的 一 部 分 ). 如 果 
接触 另外 的 p 个 人 ,可 能 得 到 不 同 的 估计 值 . 如 何 求 出 估计 值 的 误差 呢 ? 基于 两 
个 统计 学 家 内 曼 和 阿 . 皮 尔 森 发 展 起 来 的 一 个 理论 , 我 们 可 以 算出 一 个 数字 e, 使 
得 工 的 真实 值 以 很 高 的 概率 ,一 般 为 95% (或 99% ) , 落 于 区 间 (100x (vip) - e, 
100x (rp) + e) 之 内 .也 就 是 说 这 个 区 间 不 包含 真实 从 的 事件 , 等 价 于 在 装 有 
5 个 (或 1 个 ) 白 球 , 95 个 (或 99 个 ) 黑 球 的 日 袋 中 随机 地 抽取 一 球 , 抽 得 白 球 这 样 
一 个 几乎 很 少 发 生 的 事件 . 

社会 与 论调 查 的 有 效 性 ,基于 所 选择 个 体 的 “代表 性 ”, 十 分 显然 的 是 , 调查 
的 结果 是 依赖 于 所 选择 个 体 所 属 的 政治 团体 的 (民主 党 或 共和 党 ). 即便 假设 所 选 
择 的 个 人 的 政治 所 属 是 没有 偏差 的 ， 如果 有 些 个 体 不 回答 问题 , 有 些 又 恰恰 属于 
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某 些 特别 的 政治 山体 , 则 结果 也 会 不 同 . 任何 调 玛 中 , 都 有 个 同 程度 的 个 回答 者 ， 
这 种 场合 要 评价 误差 是 困难 的 , 除 划 有 更 多 的 可 利用 的 信息 . 


6.7 迷信 和 心理 作用 


当 问 到 伦理 学 家 斯 马 利 安 (RR. Smullyan) 为 什么 不 相信 占星 术 时 , 他 
说 他 是 双子 星座 的 ,双子 星座 的 人 绝 不 会 信 占 星 术 . 


我 的 一 个 朋友 盐 一 个 虚 诚 的 基督 教徒 ,他 把 刚 参 加 工作 得 到 的 第 一 个 月 的 薪 
水 全 部 捐 给 了 教会 . 当 我 问 他 是 否 相 迟 工 帝 时 ,他 回答 到 ;我 不 知道 上 帝 是 否 存 

在 , 但 相信 .上 帝 的 存在 并 以 此 来 行动 , 是 安全 的 .” 或许, 信仰 和 迷信 在 每 -… 个 人 
的 生活 中 都 存在 ,一 旦 当 它 们 变 成 一 个 人 行动 的 惟一 指导 时 ,就 会 产 牛 危险 . 

心理 作用 会 对 一 个 人 身体 的 生物 功能 产生 影响 吗 ? 很 遗憾 , 对 这 个 问题 还 没 
有 实验 证 据 . 仁 是 已 经 不 断 有 人 研究 报告 ,涉及 到 支持 所 谓 "“ 心 上 物质 之 上 "的 谈论 . 
最 近 有 -个 妍 究 报告 ,圣地 亚 肖 的 加 利 福 尼 亚 大 学 的 非 力 普 斯 {D. Phillips) 4E T 25 
年 的 时 间 , 对 老年 美 籍 华商 妇女 在 -个 重 时 的 节日 ,中 秋 节 前 后 的 死亡 率 进行 的 
调查 .他 发 现 节日 前 一 周 死亡 率 比 通常 低 35.1%， 节 口 后 一 周 外 亡 率 比 通 常 高 出 
34.6% .看 起 来 , 人 具有 一 种 能 力 来 延续 死亡 直到 经 历 某 个 占 祥 的 时 刻 . 

在 非 力 普 斯 较 早 (1977 年 ) 的 钱 究 中 , 对 1251 个 著名 的 美国 人 的 出 生 和 死亡 
月 份 数据 的 调查 的 论证 有 类 似 的 结果 . 表 6.2 给 出 了 非 力 普 斯 报告 的 数据 ,以 及 
英国 皇家 学 会 中 印度 籍 会 员 的 有 关 数 据 . 

R62 出生 月 前 后 以 及 出 生 月 闻 的 死亡 率 
6 5 4 3 2 1 月 1 2 3 4 5 

FA Qd 24 31 20 23 34 16 26 36 37 41 26 34 348 0.575 
样本 2 66 69 67 73 67 370 93 82 84 73 87 72 903 0.544 
样本 3 0 2 1 9 2 2 3 2 0 1 3 2 18 06 


注 : 产 = 在 出 生 月 和 出 生 月 后 死亡 的 人 的 比率 - 


样本 1 《400 个 著名 美国 和》 中 所 列 出 的 非常 有 名 的 人 . 
样本 2 《现代 名 人 录 》(Who Is Who) 三 卷 中 (1897 ~ 1942, 1943 ~ 1950, 
1951 一 1960) 著 名 家 庭 中 的 家 长 . 
样本 3 英国 香 家 学 会 中 大 让 的 印度 籍 理事 . 
从 表 6.2 可 以 看 出 , 出 生 月 前 去 世 的 大 数 比 在 出 生 月 中 和 出 竺 月 后 去 世 的 人 
贤人 少 .这 个 现象 在 最 苗 名 人 物 的 集合 中 是 比较 昆 营 的 . 整个 数据 看 起 来 显示 了 
趋向 : RETIREE H fa. 
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这 些 研 究 结果 是 否 显示 一 些 人 能 够 运用 他 们 的 能 力 延 缓 死亡 日 期 ， 直到 某 个 

重要 的 事件 发 和 本, 如 和 牛 日 .节日 或 纪念 口 与 这 个 类 似 的 一 个 著名 例子 是 有 关 托 蕊 
Sot CSB (Thomas Jefferson) 的 报道 , 据说 他 适 长 了 他 的 死亡 直到 1826 年 的 7 月 
4 日 一 一 刚好 独立 宣言 签字 后 的 第 50 年 , 他 仅仅 问 了 医生 :今天 是 了 月 4 日 吗 ?” 
RAET. 
像 韭 力 普 斯 发 表 的 这 样 有 关 死 亡 H 期 的 研究 报告 , AEE EA 
题 .研究 工作 中 , 普遍 的 是 有 很 多 研究 者 在 研究 同一 问题 ,或 许 是 偶然 地 , 仅仅 发 
表 了 那些 肯定 的 结果 .而 那些 舍 定 的 结果 一 般 没有 报道 , 保留 在 文件 夹 里 ,成 为 
“待考 "问题 .因此 , 如果 仅 仪 引用 发 表 了 的 结果 , 要 从 中 得 出 什么 结论 的 活 ， 需要 
WR. 
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一 般 , 不 了 解法 律 的 是 下 面 三 种 人 : 制定 法 律 的 人 、 热 行 
法 律 的 人 和 那些 破坏 法 律 而 遇 到 麻 需 的 人 . 
哈 利 法 克 斯 CHalifax) 
最 重要 的 不 仅 是 要 热 仗 正 义 ， 而 且 要 使 执 仗 正义 可 视 


过 去 10 年 中 , 统计 概念 和 统计 方法 , 在 民事 诉讼 中 解决 复杂 的 问题 时 扮演 本 
重要 的 角色 . 典型 的 例子 是 ; 有 争议 的 父 权 之 认定 ; 在 雇用 和 住房 均等 上 对 少数 
民族 的 歧视 的 申诉 ;环境 和 安全 的 规则 ; 反对 不 实 广告 保护 消费 者 .所 有 这 些 诉 讼 
中 , 辩论 都 是 基于 统计 数字 以 及 对 这 些 数字 的 解释 . 一 个 法 官 不 得 不 决定 所 提出 
证 据 的 可 信 程 度 ,并 做 出 适当 财 偿 的 台 法 裁定 . 这 个 过 程 归 求 所 有 与 案件 有 关 的 当 
事 人 辩论 的 双方 以 及 双方 的 律师 ,或 许 最 重要 的 是 那些 要 做 出 裁定 的 法 官 ,在 
某 种 程度 上 了 解 统计 学 ,以 及 应 用 统计 学 经 常 血 对 的 困难 . 

让 我 们 来 看 艾 松 (Eison) 的 诺 维尔 (Knoxville) 市 的 例子 ,这 里 ， 一 个 女 学 生 抱 
怨 诺 维尔 警官 学 校 在 进行 强力 和 耐力 测验 时 , 对 女性 有 歧视 .她 提出 的 证 搬 是 表 
6.3 中 她 班级 的 测验 结果 . 








表 6,3 ”原告 班级 的 合格 率 








人 不 合格 合格 率 
xut 6 3 0.666 
男性 34 3 0.919 





总 计 40 6 0.870 
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她 说 ,因为 比率 0. 666/0.919 —0. 725 小 于 4/5 20.8, 学 校 违反 了 雇用 均等 条 例 
(EEOC, Equal Employment Opportunity Commission) 第 45 条 人 0D. 法官 要 求学 校 提 交 
学 校 测验 结果 的 整体 报告 , 其 结果 为 家 6.4. 


X64 ”警官 学 校 全 体 学 生 的 合格 率 











合格 不 合格 合格 率 

女性 16 3 0. 842 
男性 64 3 0.955 

| gat ~ 0 6 0.930 





在 这 种 情形 下 ,比率 0.842/0. 955 =0.882 AF 0.8. 法 官 当然 有 权 说 参加 测 
验 的 是 “全 体 人 "而 不 是 一 个 特殊 的 " 子 集 合 ” 这 是 一 个 与 型 的 例子 , 即 当 事 人 所 
选择 的 进行 诉讼 的 部 分 数据 , 与 整体 数据 结果 不 同 . 

通常 ,在 一 个 特殊 的 量度 或 概念 之 下 ,基于 对 总 体 中 个 体 一 小 部 分 人 的 调查 
所 产生 的 定量 的 证 据 是 以 平均 值 或 比率 的 形式 出 现 的 .所 引用 的 数字 能 代表 总 体 
作为 一 个 整 体 的 特征 吗 ? 这 在 很 大 程度 上 二 依赖 于 所 包含 人 数 的 充分 性 .同时 , 选 
择 这 些 人 时 要 不 带 偏差. 

在 应 用 总 体 的 样本 估计 值 时 , 要求 对 所 组 织 的 调查 过 程 进行 详细 的 检验 ,如 
所 抽取 样本 的 代表 性 的 保证 , 以 友 为 了 保证 估计 值 - 定 的 精度 所 抽取 的 足够 的 样 
本 量 . 如 困 法 官能 对 抽样 调查 方法 有 -- 定 的 了 解 , 则 他 们 能 够 在 各 个 诉讼 案情 中 ， 
决定 是 否 采用 或 者 拒绝 样本 估计 值 ， 从 而 做 出 更 公平 的 裁判 这 里 并 没有 提议 -一 
个 法 宫 必 须 是 一 个 有 资格 的 统计 学 家 ,但 是 对 统计 推断 以 及 在 做 出 决策 时 对 所 包 
含 的 不 确定 性 的 知识 的 了 解 ,是 -个 法 官 的 财富 , 使 他 能 够 在 提出 的 右 关 统计 数 
据 的 辩论 中 展 成 自己 独立 的 判定 . 

在 任何 裁决 中 , 当 给 出 所 有 的 证 据 时 ,都 需要 对 一 个 事件 为 真 的 证 据 或 可 能 
性 的 程度 进行 评价 .而 且 在 做 出 决策 的 同时 ,必须 考虑 把 有 罪 的 人 误 判 为 无 罪 .无 
罪 的 人 误 判 为 有 罪 的 影响 .涉及 证 据 的 各 种 程度 的 标准 用 庄 可 表示 如 下 : 

COD 占 优势 的 证 据 ; 

(2) 清楚 和 使 人 信服 的 和 证据， 

(3) 清楚 , 盛 任何 暧昧 和 使 人 信服 的 证 据 ; 

(4) 无 任何 怀疑 的 证 据 . 
为 了 验证 法 官 一 般 如 何 解 释 这 些 证 据 的 标准 , 维 因 斯 坦 法 官 向 他 在 地 方法 院 




















”根据 美国 遍 用 机 会 均等 的 法 律 , 男性 雇用 者 的 合格 率 不 能 太 高 ,男女 的 合格 率 容许 信 
定 为 0.8. 该 法 律 的 宗旨 是 反对 种 族 , 性 等 方面 的 歧视 .一 一 译 者 注 


116 PoR 统计 学 的 公众 理解 一 一 从 数字 开始 学 习 





蜂 上 作 的 同行 们 进行 了 调查 , 各 种 证 据 标 准 的 概率 可 表 为 百分数 在 表 6. 5 中 给 
出 . 

从 表 中 可 以 看 到 , 法 官 对 4 个 标准 给 出 的 概率 是 -- 致 单调 增加 的 .然而 , PER 
高 的 证 据 标 准 程度 的 慨 闵 分 配 , 法 各 之 问 存在 EE 

实际 上 , 统计 学 中 存在 一 种 称 为 内 叶 斯 过 程 的 巧妙 的 统计 方法 ,一 个 法 官 判 
定 某 人 人 有罪 的 先 验 慨 率 能 够 由 给 定 信赖 程度 的 新 的 证 据 进 行 修订 .这 个 在 新 证 据 
给 定 条 件 下 修订 后 的 概率 称 为 后 验 概率 , 是 做 出 决策 时 的 主要 信息 来 源 .统计 学 
中 中叶 斯 决策 理论 的 发 展 似乎 是 对 公 下 执法 提供 了 一 个 客观 基础 . 


ROS 纽约 东部 地 区 法 院 法 官 对 各 种 证 据 标 准 的 概率 表示 








we > 清楚 ,使 人 D NETT 无 任何 

WR 优势 (% 信服 (%) 使 人 信服 (%) 怀疑 (% ) 
1 501 $0—70 65—15 80 
2 504 67 70 76 
3 50+ 60 70 85 
4 51 65 67 90 
5 50+ 标准 不 易 理 解 ， 不 起 作用 90 
6 50+ 70+ 70+ 85 
7 50+ 70 - 80 95 
8 50.1 75 75 85 
9 50+ 60 90 85 
10 51 不 能 用 数值 估计 





来 源 ; U.S. v. Fatico 458 F. Supp. 388(1978), p410. 


6.9 超 灵 感 与 惊人 的 巧合 


FE, 与 其 说 是 由 逻辑 , 不 如 说 是 由 统计 的 概率 来 支配 的 .然而 这 

对 字 宙 来 说 仍然 是 了 不 起 的 .如 果 人 生 就 像 掷 股子 连 续 出 现 几 百 次 6, 我 

们 知道 这 样 的 事件 在 如 此 众多 的 记 纪 里 不 会 再 发 生 第 二 次 ; 但 是 我 们 也 

知道 ,没有 破坏 字 窗 的 计划 ,今夜 在 这 个 房间 里 ,可 能 发 生 连 续 出 现 几 百 
次 6 的 事件 .这 是 令 人 安心 的 . 

切 斯 特 顿 (G. K. Chesterton) 


我 们 常常 会 看 到 一 些 报道 说 某 人 具有 趟 灵感 (ESP: Extra Sensory Perception) 
可 以 透视 他 人 的 内 心 的 秘密 ， 占 芋 术 做 了 准确 的 项 报 , 某 人 4 个 月 内 连 中 两 次 彩 
票 的 惊人 的 好 运 . 这 样 的 事件 制造 新 闻 , 可 能 会 引起 读者 的 兴趣 . 是 否 显示 存在 着 
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某 种 隐 上 着 的 能 力 引 起 这 些 事 件 的 发 生 呢 ? 

也许 完全 否认 某 些 个 人 所 纵 有 的 超 能 力 ( 如 ESP) 存 在 的 可 能 性 , RARA 
出 生 时 刻 产 处 的 行 是 位 置 可 以 决定 他 一 - 生 所 经 历 的 一 切 事件 的 可 能 性 是 不 慎重 
的 .但 是 、 这 类 报道 只 选择 成 功 的 例子 并 不 能 为 这 种 可 能 性 提供 强 有 访 的 证 据 . 

例如 ,考虑 一 个 典型 的 ESP 实验 , 实验 者 从 两 个 物体 之 中 任 取 一 个 放 在 纸板 
下 ， 归 求 被 实验 者 猜 出 故 在 纸板 下 的 物体 .这 样 的 实验 反复 进行 4 次 , 则 一 个 人 纯 
和 粹 由 猜想 得 到 所 有 站 确 答案 的 概率 为 1116. 这 就 是 说 ,如 果 从 一 般 人 集合 中 任意 
选 出 64 个 人 进行 这 样 的 实验 , 则 有 三 四 个 人 以 很 大 的 机 会 猿 中 所 有 的 正确 答案 . 
这 样 的 实验 并 不 是 表明 这 三 四 个 人 具有 超 基 感 .但 是 , 如 果 仪 仅 报 告 他 们 的 结果 
会 吸引 我 们 的 注意 力 . 

再 考虑 一 个 别 的 例子 . 如果 你 出 席 -个 全 少 有 23 个 人 的 宴会 , 询问 所 有 出 席 
AWEN, 你 会 发 现 他 们 中 有 了 两 人 生日 相同 . 这 似乎 站 知人 的 巧合 ,其 实 通过 概 
率 计算 我 们 知道 发 生 这 样 事件 的 概率 为 50% . 

在 -篇 发 表 于 美国 统计 学 会 歼 志 (Journal of the American Statistical 
Association, Vol. 84, p.853~ 880) 上 的 文章 中 ,两 个 哈佛 大 学 的 教授 , REN 
(Diacenis) 和 莫 斯 特 雷 (Mosteller) 证 明了 绝 大 多 数 的 巧合 , 如 度 作为 ~ 惊人 事件 
民 道 的 美国 暴 地 某 人 在 4 PART AKER ,是 在 一 定 的 时 间 内 以 相当 小 的 福 
率 发 生 的 . 
统计 学 中 存在 一 种 法 则 , 它 嘴 这 样 叙述 的 :一 次 实验 中 以 很 小 的 机 会 发 生 的 
事件 , 当 样 本 足够 大 时 必然 会 发 后. 并 岂可 以 在 任何 时 候 发 生 并 不 需要 归 央 于 任何 
特别 的 理由 . 
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我 希望 他 能 对 他 的 解释 作出 解释 . 
洛 德 . 拜 伦 (Lord Byron) 

我 们 在 学 校 里 学 习 三 R( 读 , 写 , 算 ), 但 光学 这 些 是 不 够 的 .我 们 更 需要 知道 
的 是 如 何 处 理 不 确定 的 情形 . 当 信 息 不 充分 时 我 们 如 何 做 出 决策 呢 ? 在 不 确定 的 
理由 下 ,学 校 教育 的 早期 阶段 府 尽 量 设 置 介绍 第 四 个 R 的 谍 程 .可 以 给 出 自然 界 
中 不 可 预测 的 事件 、 个 体 之 间 的 变化 以 及 测量 误差 的 例子 ,同时 说 明 从 这 些 情 况 中 
所 得 到 的 观察 数据 或 信息 里 ,我 们 能 学 到 什么 . 

我 们 也 应 该 探索 利用 新 闻 媒 介 ,报纸 无线电 广播 和 电视 的 可 能 性, 不断 地 向 
公众 近 行 传播 种 教育 ,介绍 政府 所 采 四 行动 的 结果 以 及 科学 家 们 的 新 发 现 .这 需 
要 具有 一 定 知识 水 准 的 记者 , 他 们 有 能 力 解释 说 明 统计 信息 并 进行 无 偏差 的 报 
道 .党 无 疑问 , 新 闻 记 者 都 会 受到 一 定 的 限制 , 他 们 不 得 不 把 报道 写 得 既 不 骨 犯 
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当局 又 要 足以 龙 动 以 便 能 够 被 总 编 接受 得 以 发 表 . 他 们 可 能 没有 专业 知识 来 进行 
独立 的 判断 , 他 们 宁愿 去 松 括 专家 们 的 建议 .或许 ,为 了 报道 统计 内 容 需 要 对 记者 
进行 一 定 的 训练 .我 十 分 理解 哈佛 大 学 的 莫 斯 特 雷 教授 为 科学 报道 记者 们 定期 开 
设 的 统计 学 课程 , 使 他 们 能 够 无 偏差 地 把 写 有 关 统计 的 内 容 ， 让 大 众 更 穿 易 惠 解 
他 们 的 报道 . 这 是 值得 一 试 的 ,大 学 里 应 该 努力 给 科学 报道 的 作者 们 设置 正规 的 课 
f. 


6.11 统计 学 , 一 门 关键 的 技术 











HE, -个 国家 的 经 济 依赖 于 它 如 何 准 备战 争 .今天 , RULE A AAR 
征 与 对 抗 到 和 和解 与 谈判 的 转换 .今后 数 上 年 内 任何 一 个 国家 所 面临 的 最 大 的 问题 ， 
不 是 战争 而 是 和 平 的 竞争 .未 来 的 戴 场 将 是 经 济 和 社会 福利 ,我 们 不 得 不 和 引起 社 
会 动荡 不 安 的 饥饿 和 掠夺 进行 斗争 .看 起 来 我 们 对 这 样 的 局 面 还 没有 做 好 充分 的 
准备 .我 们 的 成 功 将 依 种 于 如 何在 可 利用 的 资源 收集 和 处 理 所 得 到 的 信息 , 从 
而 能 做 出 最 件 的 决策 , 达到 为 了 要 改善 人 类 和 牛 活 的 质量 能 够 最 大 限度 地 利用 人 类 
和 物质 世界 的 资源 .这 必须 经 过 仔细 策划 并 保证 以 上 几 点 : 

* 进步 应 该 是 公平 的 , 持续 的 . 

* 对 生物 圈 没 有 致命 的 危害 . 

* 没有 道德 的 污染 (或 者 是 人 关 价 值 的 降低 )， 

要 达到 这 样 的 革命 ,统计 学 是 关键 的 技术 ,是 通 向 和 平 的 新 此 界 的 关键 
BOR. 
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附录 dE HIS (S. Ramanujan) 
一 一 一 位 军 见 的 天 才 


我 感到 我 被 洲 请 为 纪念 拉 总 纠 场 讲座 的 演讲 省 是 一 个 很 襄 的 荣誉 . 我 非常 高 
兴 地 接受 了 这 个 邀请 . 特别 述 因为 拉 曼 纪 扬 的 一 生 一 点 是 激励 我 那个 时 代 的 学 生 
们 的 一 个 伟大 的 源泉 ,今年 , 止 值 这 个 伟 太 的 天才 醚 生 100 周年 ， 我 们 举行 纪念 部 
动 有 着 多 方面 的 深 近 意义 . 它 提 醋 我 们 以 发 现 基础 的 零 和 负数 开始 的 印度 的 数学 
传统 依然 存在 . 它 也 提醒 年 轻 -- 代 : 他 们 能 通过 创造 性 的 思维 来 卡 富 自 己 的 人 牛 . 
最 后 ,我 希望 通过 纪念 活动 能 产后 全国 性 的 影响 ,让 公众 认识 到 数学 的 重要 性 ， 
认识 到 数学 是 科学 和 艺术 进步 的 一 个 关键 央 素 ,也 提 印 我 们 应 尽 所 有 的 努力 在 我 
国 鼓 励 数 学 学 避 和 数学 研究 . 

1986 年 ,美国 总 统 宣布 每 年 4 月 14 日 -4 月 20 日 为 全 国 数学 认识 周 
(National Mathematics Awareness Week), [| 的 是 让 美国 学 生 能 保持 学 习 数 学 的 热 
情 . ARX A T t o UR e XE. SS HERI, 任何 忽视 数学 的 侦 剖 会 被 认为 是 
对 国家 科学 和 技术 进步 的 阻 但 . 比 起 宣告 全 国 数学 认识 周 来 党 , 在 印度 , 我 们 更 
需要 的 是 公开 承认 我 们 还 没有 认识 到 我 们 的 数学 外 如 何 薄弱 ,让 我 们 通过 纪念 拉 
RARE 100 周年 来 促进 印度 数学 的 发 展 .我 们 不 应 证 世人 说 : 印度 的 数学 从 
零 开始 , 也 以 零 结 束 . 
HARRUA vE ARER ERTS, RAE UALS ee - 些 他 
HONOR. E 20 BS E E CSI rh — EE, A ET, Y. 
同样 出 乎 意料 地 在 他 32 岁 时 消失 了 .在 这 个 过 程 中 , fib p e UE T RUPES B 
版 图 , 拉 曼 纽 扬 的 数学 克 献 在 很 多 领域 内 足 深 远 的 , 永恒 的 ,他 是 上 世界 上 最 伟大 
的 数学 家 之 '. 拉 癌 纽 扬 并 没有 像 通常 的 数学 家 那样 去 学 习 数 学 ， 而 是 发 现 和 创 
造 了 数学 .这 使 得 他 成 为 “个 谜 一 样 的 天 才 ， 亩 他 的 创作 过 程 犹如 一 种 虚构 一 个 
Mis. 

riae Epid Ff ARATE: 写 在 -个 笔记 本 和 Ue n 
上 的 约 4000 个 公式 .假设 拉 曼 纽 扬 的 研究 时 间 为 12 秆 ， 则 他 每 一 天 就 发 现 了 一 
个 新 的 公式 或 新 的 定理 . 这 是 任何 -- 个 从 事 创 造 性 活动 的 人 不 能 与 之 相 比 的 .这 些 
并 不 是 通常 的 定理 , 它们 中 的 每 个 都 足 产生 个 全 新 的 理论 的 核心 .这 些 公式 
和 定理 并 不 是 凭空 想像 出 来 的 “: 连 串 孤立 的 魔术 身 的 公式 ,有 的 自身 对 今天 的 数 
学 研究 仍 有 深远 的 影响 , 更 进一步 说 , 在 理论 物理 中 从 宇宙 论 的 超凡 理论 到 复杂 
的 分 子 系统 的 统计 力学 ， 这些 公 式 和 定理 在 发 展 新 概念 方 断 同样 共有 深远 的 影 
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Vg. 1976 第 在 剑桥 :一 学 院 的 图 Ift Ar |n T fi A EH IT, P T 130 页 
We OE LA HBA EEE E89. C. 仅仅 是 在 《补遗 杂记 》 中 给 州 的 结 
已 经 认为 “等 价 末 -- 个 伟大 的 数学 家 一 生 的 工作 "了 .威斯康星 大 学 的 阿 斯 宛 
(Askey) 教 授 在 评述 拉 曼 纽 扬 的 贡献 的 独创 性 ,深远 性 和 永久 忻 时 涪 到 :; 

他 的 工作 乍 一 看 来 几乎 是 不 可 预测 的 . 当 了 解 其 内 容 以 后 ,可 以 保 

守 地 断言 他 的 工作 所 涉及 到 的 大 部 分 内 容 ,， 是 任何 生活 在 当今 世纪 的 人 

不 可 能 再 发 现 的 .而 且 , 拉 枝 纽 扬 发 现 的 某 些 公式 ， 至 今 没 有 人 能 理解 

或 和 证明. 我 们 恶 怕 永 远 不 会 了 解 拉 曼 纽 扬 是 如 何 发 现 这 些 公式 的 . 

要 理解 拉 昌 纽 扬 的 创造 性 是 困难 的 ;在 科学 研究 或 艺术 创作 的 纪要 中 不 存在 
相似 的 记载 . 拉 芝 纽 扬 发 现 的 能 支配 整数 无 限 集合 的 神秘 定律 和 相关 的 关系 ,， 犹 
如 一 个 科学 家 试图 发 现 宇宙 中 隐藏 的 控制 自然 蜡 点 物 的 法 则 一 样 , 这 是 几乎 让 任 
何 一 个 科学 家 都 感到 敬畏 和 头疼 的 . 让 我 们 来 看 OE BERE i TE S Cn iln 
1919 年 所 做 的 关于 函数 p(n) 的 一 个 狂想: 如果- 一 个 整数 ”可 表 为 与 顺序 无 关 的 
几 个 非 负 整数 的 和 , 则 可 定义 p(x) 的 组 合 形式 为 

如 果 24z — 1 = 0 (S*7 Hc), W p(n) = 0 (54711). (D 

XAR SKI RU im HX ERE SRM RB, 因为 
ARRAK, ZEND RERE HRK - 般 理 论 中 没有 产生 任何 这 类 的 结果 . 另 
一 个 印度 数学 家 乔 拉 (Chowla) 证 明 这 个 猜想 是 错 的 ,内 为 当 243 时 它 不 成 立 . 
由 阿 特 金 (Atkin, 1967) [Glasgow Math. J. ,Vol. 8, p. 14—32. HBA, 上述 公 式 似 
需 稍 加 修正 : 


ME 24s — 1 = 0 (972100, pla) = 0 G7 9 up). (2) 








即 公式 (1) 中 第 一行 7 的 指数 6 RIO +1. 如 果 拉 冯 纽 扬 利 用 数学 推导 , 或 许 


他 可 以 得 到 止 确 的 结果 , 但 他 没有 得 到 正确 的 公式 这 件 事 相对 来 说 是 不 重要 的 ; 
他 的 想像 形成 这 样 性 质 的 结构 的 概念 让 实 了 这 个 发 现 背 后 无 法 解释 的 他 的 已 维 
过 程 . 

一 个 人 如 何 得 到 一 个 卓越 的 概念 虽 ? 必 变 成 创造 性 的 忠 维 , 需要 收 什 么 样 的 
Ted E 一 位 大 才 是 天 生 的 .还 是 造就 的 ? 或 许 对 这 些 问 题 并 没有 肯定 的 答案 . 然 
而 ,即便 有 答案 , 我 们 恐怕 也 不 能 解释 拉 党 纽 扬 的 大 脑 里 为 何 能 迅速 地 产 咎 如 此 
众多 的 卓越 的 想法 , 虽 司 人 感 兴趣 的 是 , 因为 拉 总 纽 扬 没 有 接受 过 正规 的 高 等 数 
学 教育 , 从 来 没有 着 于 过 数学 研究 , 也 并 不 知道 现代 数学 中 研究 问题 的 领域 或 方 
向 .他 令 述 定理 而 没有 给 出 证 明 , 也 没有 指明 动机 . 拉 受 纽 扬 无 法 解 丢 他 如 何 得 到 
这 些 结果 .他 常 说 这 些 公式 十 拿 摩 卡 女神 在 梦 中 赐 给 他 的 ,他 常常 一 起 床 便 记 求 下 
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这 此 结果 并 过 如 地 验证 它们 ,尽管 有 时 并 不 能 给 出 严密 的 证 明 . 经 过 验证 拉 曼 纽 扬 


叙述 的 定 纤 很 多 是 正确 的 .在 潜意识 下 产 生 创 造 性 吗 ? 


马 哈 拉 庶 比 斯 教授 与 拉 总 组 扬 当 年 同期 在 英国 剑桥 . 他 总 是 讲述 有 关 拉 曼 纽 
扬 的 轶 于 ,这 些 铁 事由 冉 甘 纳 让 5S. E. Ranganathan iu EG BA, AG 
数学 家 》 这 本 传记 中 了 .这 里 从 自 H 纳 让 的 书 中 , 我 引 录 一 则 从 马 哈 拉 诺 比 斯 教授 


TRACI SERS. 


一 次 , 我 去 他 ( 拉 曼 纽 扬 ) 的 房间 . 那 时 正 是 第 一 次 世界 大 战 刚刚 开 


始 不 久 , 我 手 里 拿 着 一 本 《困境 月 刊 ， 那 本 杂志 当时 总 登载 难题 让 读者 
解答 . 拉 曼 组 扬 正 在 炉子 上 的 锅 里 搅动 着 什么 菜 准 备 我 们 的 午饭 ,我 靠 着 
一 张 朱子 坐 下 ,翻阅 着 杂志 .一 个 有 关 两 个 数 的 关系 的 问题 引起 了 我 的 
兴趣 . 问题 的 具体 内 容 已 经 记 不 起 来 了 ,但 我 记得 问题 的 类 型 .两 个 英国 
官员 住 在 一 条 大 街 上 两 套 不 同 的 房子 里 ,他 们 在 战争 中 被 杀害 了 ;他 们 
房子 的 门牌 号 数 之 闻 有 某 种 特殊 的 关系 ,问题 是 求 出 这 些 数 . 这 个 问题 并 
不 很 难 , 用 反复 试验 法 ,我 几 分 钟 就 得 到 了 答案 . 

我 说 (开玩笑 地 ): 现在 考 你 一 个 问题 . 

REB): 告诉 我 什么 问题 . (一 边 继续 搅动 锅 . ) 

我 读 了 《困境 ) 杂 志 上 和 登载 的 问题 ， 

AR mds. 请 记 下 答案 .( 他 给 出 了 一 个 连 分 数 .) 

第 一 项 是 我 得 到 的 答案 .其 余 各 项 就 像 街 上 的 门牌 号 数 无 限 增 大 一 
样 , 表 为 逐渐 增 大 的 具有 同样 关系 的 两 个 数 之 间 的 过 次 解 .我 感到 非常 
惊奇 就 问 到 ; “你 在 一 瞬间 就 得 到 这 个 答案 了 吗 ?” 

Ham: 当 我 听 到 问题 时 ， 即刻 清楚 地 知道 它 的 解 显然 是 一 个 迷 
分 数 ;我 就 起 : “这 是 一 个 什么 样 的 连 分 数 呢 ?” 然 后 答案 就 出 来 了 , 就 这 
么 简单 . 


从 冉 廿 纳 让 的 记载 旦 我 们 知道 , 近 曼 纽 扬 12 岁 时 表现 出 了 对 数学 的 兴趣 . 据 
说 当时 拉 曼 纽 扬 曾 经 问 他 在 昆 巴 床 纳 市 区 高 级 中 学 高 个 级 三 学 习 的 一 个 朋友 , 什 
么 是 数学 中 的 "最 高 真理 ”, 据 说 这 个 朋友 给 他 提 到 毕 达 哥 拉 斯 定理 ,股票 和 股份 问 
题 作为 "最 高 真理 ”. 毕 达 母 拉 斯 定理 属于 正统 的 数学 , 因为 结论 是 在 给 定 的 前 提 





下 通过 一 系列 演绎 的 扒 论 得 旬 的 ,不 存在 任何 有 关 结 论 的 不 确定 怀 问 题 . 





投票 和 股 


份 问题 属于 概率 论 ,这 里 所 得 到 的 结论 不 定 要 求 必须 准确 , 但 是 对 投资 家 有 帮 
助 .两 个 问题 均 是 学 习 和 研究 中 显示 忽 力 地 具有 挑战 性 的 领 砧 .或 许 是 比 起 股票 和 


股份 问题 来 说 , 拉 曼 纽 扬 喝 熟悉 毕 达 哥 拉 斯 问题 ,这 就 使 他 迷 上 了 数学 ， 
拉 曼 纽 扬 在 笔记 不 上 记录 下 来 的 绝 大 部 分 结果 是 无 证 明 的 ,据说 他 











石 笔 在 








石板 上 进行 推导 ,而 仅仅 把 最 后 结果 记录 在 纸 上 . 当 问 他 为 什么 不 用 纸 时 ， 拉 曼 
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纽 扬 回答 的 是 他 一 周 需 要 二 令 纸 了 ,他 没有 钱 来 买 姥 么 多 纸 . 

1914 年 拉 曼 纽 扬 去 英国 便桥 哈代 博士 处 工作 之 前 , 他 在 印度 杂志 上 一 共 发 
表 了 5 篇 沦 文 .由 他 独自 署名 或 与 哈代 合作 ,他 一 生 共 发 表 了 37 篇 论文 . 在 他 短暂 
前 研究 生涯 内 , 这 些 论文 发 表 的 时 间 分 布 如 下 ; 

期 间 一 1914 1914 1915 1916 1917 1918 1919 1920 1921 
论文 数 5 1 9 3 7 4 4 3 1 
HERAF 1920 年 , 时 年 33 岁 .在 他 生命 最 后 的 两 一 年 里 , 他 的 健康 状况 越 来 
UR, 但 他 仍 继续 进行 评 究 并 把 很 多 结果 记录 在 一 个 笔记 本 上 ,这 个 笔记 本 直到 
刀 年 前 才 被 发 现 .这 个 被 称 为 《补遗 杂记 》 的 笔记 本 上 有 很 多 新 的 定理 ,其 开创 了 

数论 研究 的 新 领域 . 

GR, 拉 曼 纽 扬 是 一 位 少 有 的 天 才 . 他 在 或 多 或 少 的 恶劣 环境 中 开花 结果 .在 
这 样 的 环境 中 常规 运转 的 教育 系统 培养 管理 工作 通常 需要 文书 公务 员 ; 有 天 才 的 
学 生 人 缺乏 制度 上 的 支持 或 者 是 其 他 前 机 会 开展 研究 ,贫穷 妃 使 他 们 不 得 不 放 穿 对 
学 术 的 追求 而 为 谋 牛 去 求职 .对 于 拉 曼 纽 扬 在 数学 上 的 成 就 , 尼 苗 凤 在 他 《印度 的 
发 现 ) 一 书 中 写 道 ; 

拉 曼 纽 扬 短 暂 的 一 生 和 他 的 去 世 是 印度 现状 的 一 个 代表 . 几 至 万 人 

中 有 多 少 完全 党 到 教育 了 呢 ? 有 多 少 生 活 在 饥饿 的 边缘 呢 ? 如 果 对 他 们 

打开 生活 的 大 门 ， 提 供给 他 们 食物 、 健 康 的 居住 条 件 、 教 育 和 成 长 的 机 

会 ,这 几 百 万 人 中 会 产生 出 多 少 杰 出 的 科学 家 、 教 育 家 、 技 术 工作 者 、 企 

业 家 、 作 家 和 艺术 家 来 帮助 建立 一 个 新 印度 和 一 个 新 世界 呢 ? 

尼 赫 鲁 是 一 个 理想 家 .确实 , 印度 的 状况 这 几 年 有 了 相当 的 改善 . 现在 , 印度 
科学 的 平均 水 平 可 以 与 任何 先进 国家 相 比 .但 是 , 总 的 感觉 是 : 我 们 仍然 没有 达 
到 完美 和 理想 的 水 平 . 我 希望 , 我 们 的 政府 和 研究 机 构 ( 在 统计 学 家 的 帮助 下 !) 进 
行 调查 研究 ,为 把 印度 置 于 草 新 和 科学 发 性 的 最 前 沿 而 向 出 必要 的 努力 . 





















































OD 今 为 量 纸 的 单位 , 一 令 等 于 480 张 (或 500 张 ). 一 一 译 首 注 


R 


A 


阿 ' 皮 尔 森 (Pearson, E.S.) 41,46 


HEBEN (Ain-i-Akbari) 32 
RIB (Eddington, A.S.) 05 
埃 尔 大 伯 克 (Elveback, L.R.) 49 一 50,62 
Ri  (Efon,B.) 9,18,62,87,104 
RRR  CAchenwall,G.) 32 
RAMH (Einsein, A.) 1,16~17,24 
氨基 酸 (Amino acids(D&IL)) 95 

B 
E0 (BudenS.) 105 


柏拉图 (Plato) 90 
Flt (Babbage, C. ) 
拜 伦 (Byrn,L.) 118 
BOT (Bose,R.C.) 45 
贝尔 纳 (Hemalj.D.) 106 

贝 叶 斯 (Bayes T.) 40 
贝 叶 斯 定理 (Bayes Theorem) 40 
AS 34  (Johnson,B.) 88 一 89 
HERR (Picasso,P.) 23 
辨 明 牛 父 
波 利 亚 (Polya) 11 
BENE (Boneva, L. L. ) 
波 帕 (Popper, K.) 11 
RBS (Boltzmann, L.) 14,18 
XE (Bom,M.) 15 
BE (Boss, S.N.) 15 
玻 色 - 爱 因 斯 出 (理论 ) 
404% (Banc) 52 
RAE {Poisson distribution) | 79-- 80 


33,57 


(disputed paternity) 97 


90,103 


(HBos-Einsten). 15 


引 


不 确定 性 (uncertainty) 35 
布 罗 德 (Broad,W.) 52,55 


c 


ERF (Charfield, C.) 46,62 
超 灵感 (ESP) 118 
AUPE 
出 版 年 月 (dating of publications) 90 
出 生 顺 岸 (birth order) 75 
初始 数据 分 析 (initial data analysis) 47 
创造 性 15 一 16 


(sampling error) 46 


Cereativity) 
D 


大 数 律 
LE 
REN 


(Law of large number) 8,15 
(Diaconis,P.) 118,119 
(Devis, T.A.) 94~95 

丹 齐 克 (Danzig, T.) 36 

刀 切 法 (jack-knife) 60 

道 尔 〈Doyel,C.) 44 

道 尔 顿 (Dalton,J.) 55 

德政 斯 (Deshayes, M.) 92 
等 待 时 间 悖 论 (waiting time paradox) 78 
RJL (Descartes,R.) 241 

地 质 年 代 的 尺度 (geological time scale) 92 
第 三 种 误差 (third kind of error) 64 

蒂 皮特 《Tippett,L.H.C.) 3,8,19 
赌 徒 误 解 (gambler's fallacy) 11 

对 数 级 数 (logarithmic series) 67 

多 恩 (Donne,J) 88-89 


E 


IHE. 76 (binary sequences) 3 一 4 


124 





F 


非 参数 统计 检验 (nonparametric test) 45 

JEHA (Phillips, D.) 114—115 

HRE (Feigenbaum, M.J.) 20 

费 勒 (Feller, W.) 68,79,80 

SUK (Fisher, R.A.) 3,10,36,40,45— 46, 
48,51,53.61,65, 80, 84,85, 88,92 — 93, 103 
一 104 

码 - 比 尔 夫 德 、(Bielfeld,J.von) 32 
ABIL (Fractal Geomeuy) 20 

弗 莱 明 (Fleming, A.) 23 

FeRAM (France, A.) 1 

莫 罗 斯 特 (Frost,R.) 1 

福克斯 (Fox,Captain) 56 

HEMT (Fox,J.P.) 49—50,62 


G 


盖 沼 普 民 意 调查 (Gallop polls) 113 


概率 比例 抽样 法 (Pps. sampling) 68 


高 斯 (Gauss,K.) 14 

Xd: (Ghosh,J.K.) 21--23 

哥 德 尔 (Godel, K.) 22,36 

歌德 (Gothe) 1 

格兰特 (Graun, J.) 33 

WHR (Gleick,J.》 13~ 14,18 
MPRA (Grosvenor,G.C.H.) 47 


归纳 法 ,归纳 (induction) 37~38,40 
国际 统计 学 会 
tue) 34 


CInternational Statistical Insti- 


H 


哈代 (Hardy,G.H.) 36—37,123 
哈 德 马 德 (Hadamard. J.) 21 
哈 尔 堡 (Halberg,j.) 96,104 
MWS (Hacking,T.) 30,44,62 
喻 利 法 克 斯 (Halifax) 115 
哈密 顿 (Hamilton, A.) 89 


哈 特 林 (Hotelling, H.) 45 

ARA (Hul,T.E.) 7,18 

HAR (Huxley, T.H.) 83 

后 分 层 (post stratification) 61 

后 验 分 布 (posterior distribution) 58 
HE | (Wallace,D.L.) 89 

混沌 (chaos) 3,20 

HA 《Hall,C.E.) 49~50,62 
RRM (Haldane,J.B. S.) 52,54,62 
AMS (Hofstadter, D.R.) 17 
BPR 《Heyle,F.) 12 





J 


AMHR (Galileo, G.) 14,55 

机 会 ,偶然 性 ,可 能 狂 (chance) 2,12 
加尔各答 (Calcuua) 61 

MIFE (cooking of dam) 57 

加 权 二 项 分 布 (weighted binomial) 69~74 
加 权 分 布 (weighted distribution) 65,67 
建 模 (model building) 11 

交叉 核实 (cross validation) 61 

WI (Jefferson, T.) 115 

ARG (Jay,J.) 89 

截断 , 截 尾 《truncation) 65 
截断 一 项 随机 变量 (truncated binomial) 65 
经 验 定理 (Empirical theorems) 69—74 
决策 (decision marking) 84 

决定 论 (determinism) 13 


K 


上 "皮尔 森 (Pearson, K.) 7~8,40,44,62 
特 亚 {Kautilya) 31~32,90,107 
卡 方 检验 (Chisquare test) 45 

卡 克 (Kac,M.) 20—21,93,104 








卡 姆 拉 (Karmmarer,P.) 12,18 
FEE (Kappler) 21 
BBFS (Koester, A.) 16 


SUB (Quede, A.) 14,19,33 ~34 





索引 


125 





考 克 斯 (Cox, D.R.) 41,79,80 
柯 尔 莫 至 洛 夫 (Kolmogorov, A.N.) 8 
柯南 ' 道 尔 (Conan Doyle) 44 
科学 法 则 (scientific laws) 82 


L 


æE (Lazzarini(Lazxerini)) 56~57 

HPH (Roy,R. R.) 26,108 

tema (Ramanujan, S.) 16~18,21,28, 
120—123 

TIS SEU BZIiE) (Lost Note Book(Ra- 
manujan) 18 

BRHUEE (Laplace, P.S.) 13,18,33,57 

拉 普 拉 斯 的 数学 神灵 (Laplace, Demon) 13 

拉 合 特力 售 (Rastrigin,L.) 27 

RIK (Lyell,C.) 92 

BRAS (Ryle,M.) 12 

朗 费 罗 (Longfellow, H.W.) 110 

劳 (RasC.R.) 21 ~22,50,62~ 63,65,67 
~ 68,70, 78-79, 80—81,96,104 

雷 斯 (Race, R. R.) 102,104 

Æ (Le) 112,119 

历史 中 的 谎言 (Deceit in History) 55 

联邦 主义 者 论文 集 (Federalist papers) 89 

SEAS (law of series) 12 

HUE (Levi, E.) 27—28 

列 文 托 CLevent,O.) 113 

$f (Rubin, H.) 80 

P (Roy,S.N.) 45 

Welk (Lorenz, E.) 13,20 


M 


麻疹 (Measles) 49—50 

Thie (Marbe,K.) 12,19 

马 德 森 (Madison.J.) 89 

马尔 切 斯 (Malhus,C.A.V.) 33 

马 哈 拉 庶 比 斯 (Mahalanobis, P.C.) 9,18, 
46,62,82,100,122 


EX EH 
媒介 分 析 


{Mandelbrot,B.B.) 11,19,20 
{meta-analysis} 59 


至 德尔 (Mendel,G.) 14,19,26,53 


蒙特 卡 罗 


{Monte Carlo) 7~8 


密 立根 (Millikan,R.) 55 
WE (cryptology) 10 


描述 数据 分 
敏感 问题 


析 (descriptive data analysis) 44 
(sensitive questions) 12 


模糊 集 (fuzzy seu) 27 
模糊 性 (ambiguity) 27 
莫 兰 特 (Mourant.A.E.) 102,104 


英 斯 特需 
118—119 


(Mosteller, F.) 46, 62, 89, 104, 


N 


纳 利 卡 CNarlikar,J.) 12,19 


南 丁 格 尔 


(Nightingale, F.) 105 


WE (Neyman,J.) 34,40,46,113 
MAS (Nehru,}.) 123 

尼 塔 (Nia,S.C.) 91,104 

和 牛顿 (Newton,L) 23,54—55 
WSE (Neumann,von) 64 


o 
要 性 (chance and necessity) 25 


P 


W (Panum,P.L.) 50 
WEB (Pail, G.P.) 68,78,80 


PR (Penrose,R.) 24 


皮特 曼 (PimanE.].G.) 45,62 


WEHE 
普 洛 塔 斯 


人 工 智 能 
容量 有 仿 


(Buffon needle problem) 56 
(Plutus) 2 


R 


(artificial intelligence) 11 
(size bias) 67,78 
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通讯 的 秘密 化 (encryption of messages) 10 


s 统计 ,统计 学 (statistics) 

BEA (Savage,L.].) 106 统计 的 发 展 , 进 化 《evolution of) 30 
FERRAR (Johnson Samuel) 107 统计 的 森 来 (Future of statistics) 42 
ME  (Genguputa,]. M.) 98 统计 的 未 来 “(future of) 42 
BLOW (Shakespeare, W.) 11,87- 89,90 ”统计 基本 方程 “fundamental equation of) 
莎 十 比 业 《 爱 的 徒劳 》 (Lowe's Labors Lost) 47 

90 统计 技术 (technology》 42 
(entropy) 3 SPER TEA (logical equation of) 38 
WERE (specification errur) 64 统计 科学 (science) 42 
施 密 特 {Schmidt,J.) 93 统计 学 会 (sodenes) 32—34 
“tilt fi] (decimal notation) 101 统计 艺术 《arD 42 
时 间 生 物 学 〈Chroncbiology) 96 统计 质量 控制 (statistical quality control) 86 
BJA (publicistics) 33 FLA (Tullius S.) 31 
试验 设计 (design of experiments} 10 推 产 数据 分 析 Gnferential data analysis) 44, 
试验 设计 (experimental design) 10 47,60 
BURMA (editing of data) 49 OR (Prolemy,C.) 55 
数据 的 交叉 检验 (cross examination of data) w 

47-48 
数学 恶魔 ,数学 神灵 (Mathematical demon) REA (Wilks,S.) 45 

13 威尔士 (Weirus) 107 
MHARE (Smullyan, R.) 114 威 尔 斯 (Wells, H.G.) 86 
斯 马 特 (Smar, R.G.) 75~78,81 BEARRA (Westfall, R.S.) 52 
REFER (Spot, D.A.) 75~78,81 为 …… 服 务 的 统计 (statistics for) 
SHER (Sperry,R.) 95 为 一 般 人 服务 的 统计 Cayman) 85 
斯 特 任 格 尔 《Sterzinger,O.) 12,19 为 政府 服务 的 统计 (government) 86 
随机 数 (random numbers) 3 维 纳 (Wiener, N.) 17,23 
随机 性 (randomness) 1-3 维 因 斯 坦 (Weinstein,) 117 
损伤 模型 (damage model) 79 伪造 前 (faking) 51,54 
SAR (Souriau,) 23 伪造 数据 (forging of dara) 57 
REHA (Southwell, R.) 2 BUR (Wed H.) 23 

T PHVB (file drawer problem) 59 


RRE (Wald,A.) 40~41,46,63 
ARE) 《Taylor,G.) 87 BIKE {Wolf) 56 

探索 数据 分 析 (exploratory data analysis) 46 TIREE (contaminated samples) 58 
WARS (Trautmann,T.R.) 90,104 

WIE (Tukey, JW.) 46,63 

大 气 预 报 (weather forecast) 39,43, 112 FMA S 【lilhert,G.) 22 
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Hig (Hickerson, D.R.) 18 
先 验 分 布 (prior distribution) 58 
香农 (Shannon, C.) 107 

MAM (Shaw,G.B.) 23 

FER  (Sindei,].) 33 

休 喻 特 (Shewhart, W.) 46,63 
修饰 数据 (rimming of data) 57 
FRH 
MEPE 
血液 检查 


(sequential sampling) 46 
(aleoholism) 75 
(blood testing) 98 


Y 


亚 地 (Yardi) 90.104 
亚 里 士 多 德 (Aristotle) 
演绎 ,推断 (deduction) 
样本 抽样 ,抽样 调查 
耶 芯 (Yates) 3 
HWE (outliers) 46,50 

因果 报应 学 说 (Kama) 1 

印度 经 典 (Arthasastra) 32,90,107 
纯度 统计 研究 所 
3 

有 争议 的 作者 权 (disputed authorship) 89 
WP (abduction) 39~40 

与 数据 对 话 (dialogue with data) 100 

E ERE (glotto chronology) 91 

诸 言 树 


1,41 
35— 36.40 


(sample surveys) 9 


(Indian Statistical Institute) 





(language tree) 91 


原稿 的 鉴定 (filiation of manuscripts) 91 

AUR RD (Gauss) 23 

HRB Johannsen, W.) 93 

在 …… 中 的 统计 (statistics in) 

法 律 中 的 统计 (law) 87 
工业 中 的 统计 (industry) 86 
考古 学 中 的 统计 (archaeology) 87 
科学 研究 中 的 统计 
86 ， 
文学 中 的 统计 (literature) 86 
医学 中 的 统计 (medicine) 86 
侦探 工作 中 的 统计 (detective work) 87 
商业 中 的 统计 (business) 86 





(scientific research) 


Z 
MZF (Xenophanes) 82 
张 左 (音译 ) (Zhang Zhuo) 28 
指数 分 布 (exponential distribution) 78 
智商 指数 的 欺骗 {IQ fraud) 52 
自助 法 (bootstrap) 9,60 
FEF (Cleft handed) 94 


H 他 


Rh 因子 (Rhesus factor) 101 
Zytkov.J.M. 24 


zt 的 倘 计 (estimation of x) 56~57 


gk 


笔者 自 1984 年 起 , 与 作者 C. R FARMA HARE, 共同 从 事 研究 工作 达 6 年 
之 久 . 以 后 我 们 一 直 保 持 考 密切 的 联系 .彼此 之 间 , 生活 上 犹如 一 家 , 学 问 土 如 同 
师 生 ,相处 甚 为 融洽 . 今 能 为 《统计 与 真理 一 一 怎样 运用 偶然 性 ?一 BER, 是 一 


大 荣幸 





C-R. 劳 万 当今 仍 健在 的 此 界 上 的 最 伟大 的 统计 学 家 之 一 .他 的 一 生 是 辉煌 
的 , 他 的 学 识 是 浏 情 的 ,他 对 学 术 的 贡献 是 无 与 伦比 的 . 在 介绍 《统计 与 真理 一 一 


怎样 运用 偶然 性 ) 一 书 之 前 ， 让 我 们 首先 简单 回顾 一 下 他 的 经 历 . 





C.RR. 劳 教授 后 于 1920 年 9 月 10 0, 他 出 生 在 印度 卡 那 塔 加 (Karnataka) 省 
的 孝 达 加 利 (ITIadagari) 一 个 丰 族 家 庭 . 他 的 全 名 是 吉利 业 木 普 迪 : 拉 达 克利 内 纳 
39(Calyampudi Radhakrishna Rao). 劳 (Rao) 本 来 是 印度 人 为 区 别 其 身世 及 社会 地 








位 的 Ge AGES, 就 如 同 英国 人 名 前 缀 Sir CIS 

















上 ) 一 样 .因为 印度 人 的 名 字 都 很 


长 , 通常 , 尤其 是 到 了 国外 以 后 ,多 数 印度 人 部 会 将 名 字 简 化 . m, 大 都 知道 


C.R. 劳 而 不 人 有 人 知道 他 的 全 名 了 了. 





CR. A SURE -个 有 志气 的 人 . 当 大 们 问 他 为 什么 学 统计 时 , 他 说 : 他 出 





身 于 一 个 贵族 家 庭 , 他 不 知道 这 个 家 庭 究竟 有 多 少 财产 , 反正 这 个 家 族 里 没有 人 
为 衣食 或 做 什么 事 担忧. 但 是 , 他 却 不 床 意 依赖 家 族 的 财富 虚度 自己 的 一 生 . 好 在 
这 个 家 族 也 不 会 干涉 他 … 个 人 去 做 什么 , 于 是 他 就 去 读书 .他 20 岁 时 , 也 就 是 
1940 华 , 他 获得 了 印度 安 德 拉 (Andra) 大 学 的 数学 硕士 学 位 . 当时 时 近 第 -次 世 
界 大 战 ， 只 有 一 个 数学 学 位 的 人 很 准 找到 工作 .他 找到 大 名 易 瞻 的 统计 学 家 马 哈 
拉 诺 比 斯 (Mahalanobis), 马 氏 建议 他 改 学 统计 学 , 说 拿 到 一 个 统计 学 位 证 书 , 就 
是 取得 了 一 -个 找 工作 的 通行 证 (passport). 于 是 他 到 印度 名 牌 大 学 加 尔 各 答 


(Calcutta) 大 学 学 习 统计 ,并 于 1943 年 拿 到 统计 学 硕 寺 














上 学 位 . 


他 坚实 的 数学 基础 在 学 习 统计 学 时 发 挥 了 作用 . 他 利用 马 氏 距离 


(Mahalanobis distance) 解 决 了 人 类 分 类 学 上 








Pp 一 个 


要 问题 ,其 得 马 氏 的 赏识 . 当 


BL, 英国 剑桥 的 一 个 人 类 学 博物 销 从 非洲 运 回来 大 量 的 骨头 和 化 石 ， 要 求 印度 的 
统计 人 研究 所 派 人 去 参加 这 项 研究 . SBE CR. FEBS MAA. 这 大 慨 是 


C.RR. 劳 一 牛 中 重大 改变 的 契机 . 





他 在 工作 之 余 到 剑桥 大 学 攻读 博士 学 位 .他 的 导师 就 是 数 奋 统计 学 的 莫 基 人 
R.A. Ba (Fisher) EE. X BL DT C. R. 劳 来 说 是 光辉 的 , 但 绝 不 是 轻松 愉快 
的 . 费 歌 告诉 他 必须 去 养老 段 . 其实 何止 养老 局, BRAS RI. 当时 , ARKET 
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研究 染色 体 与 基因 的 关系 , 他 的 上 几 个 助手 , ARES A IET RBS RC. Br 
以 ,至 今 仍 有 人 开玩笑 说 ,， 芳 就 中 那个 蔡 费 睦 养 苦 鼠 的 年 轻 人 ,试想 ， -个 出 身 贵 
TERE FDU Y (6A UA dE n a PR DTE, 是 多 么 的 不 容易 , 多 
么 的 难能可贵 呀 ! JS TORTE, 为 了 学 到 真 本 领 , 他 不 怕 苦 , RRR, ARR 
W, AE 1948 年 ,终于 将 尽 廿 来 ,他 取得 了 英国 剑桥 大 学 的 统计 学 博士 学 位 . 

SAE IB RAEN, 但 也 是 燃 御 的 .他 的 许多 成 就 是 他 在 学 生 时 期 取得 
的 -例如 ， 善 各 的 格拉 姆 - 劳 (Cramer-Rao) 不 等 式 就 发 表 在 他 1945 年 的 一 篇 文章 
里 ,其 实 要 比 格拉 姆 (Cramer) 发 表 此 不 等 式 早 两 年 ,这 个 不 等 式 , 成 了 以 后 信息 理 
iG (information theory) f] El. 1945 ^p, 为 了 改进 并 推进 费 软 的 -- 项 工作 , HAR 
了 男 一 篇 文章 , 他 提出 了 二 阶 效 (second order cfficency) 的 概念 ,这 对 于 统计 学 的 
发 展 又 是 一 项 重大 的 英 基 石 .1972 4E SOPH (Stanford) KF IS X 44 SR (60 IR IB 
ZEB. Efron) 教 授 提 出 并 发 表 了 EE, 将 微分 几何 学 引 估 数 建 统计 学 之 中 ， 
今 大 已 成 为 统计 学 中 的 一 个 重要 的 分 支 . 埃 弗 龙 将 他 的 工作 渊源 于 C. R. 3 1945 
年 的 工作 . 

从 此 ,C.R. 劳 成 了 世界 统计 学 界 一 个 响当当 的 人 物 ， 党 党 灿 灿 的 明星 . 至 今 ， 
fH 1533 部 , 发 表 学 术 论文 400 RA. H 1965 年 末 获 剑桥 大 学 的 科学 博士 以 
来 , 已 铸 得 荣誉 学 位 25 个 , 其 地 威 竟 包括 英国 .印度 、 苏 联 、 希 腊 、 美 国 、 秘 鲁 、 
PRR .瑞士 .波兰 .斯洛伐克 此 德 ,西班牙 以 及 加 拿 大 等 14 个 国家 ,又 先 
后 被 选 为 美国 科学 院 、 第 三 直 界 科学 院 、 英 国 皇 家 统计 学 会 等 31 个 国际 著名 的 科 
学 或 统计 学 研究 机 构 的 院 十 理事 或 荣誉 院 上 ,获得 10 项 重大 统计 学 大 奖 . 

他 的 杰出 真 献 包括 : 

一 、 估 计 理 论 . 格拉 姆 - 劳 不 等 式 以 及 劳 -布莱克 韦 尔 (Rao-Blackwell) 不 等 式 
态 小 样本 理论 中 的 基本 不 等 式 . 费 软 - 筋 香 论 是 研究 二 阶 效 的 起 源 的 重要 理论 上 基 
础 .其 他 重要 页 献 包括 MINQE fiit, 4 OUS - 97 CSchelfer- Lebman-Rao) E F8 , 
Ta ABER ££ ERR P ES 6 P 3TH IE CL MINQE 估计 的 统一 理论 等 . 

二 、 渐 进 推断 ， 劳 的 另 … 项 先驱 性 的 贡献 就 是 记分 检验 (score-test) . 这 项 结 
果 发 表 在 他 1947 年 的 - -篇 文章 中 . 这 项 工作 以 后 发 展 成 为 许多 重要 分 支 ,例如 
经 济 学 中 的 LM 检验 ,以 及 统计 学 中 的 劳 氏 准 记分 检验 (Rao’s pseudo score test), 
内 曼 - 劳 (Neyman-Rao) 的 Ca) 型 检验 , 者 是 基于 劳 的 记分 检验 的 思想 发 展 起 来 
fy. 

三 、 多 元 分 析 . HNL HAR BAS AY. 如 前 面 提 公 的 在 人 类 分 
类 学 中 的 工作 等 , 其 最 重要 的 儿 项 页 献 可 概括 为 群 族 相关 分 析 (familial 
correlations) JF U -检验 . 威 尔 克 斯 (Wilks)A 准则 前 劳 氏 下 近似 (Rao’s F- 
approximation? 94 E& Bae RAY F EGY 268 (Rao! s quadratic entropy) 等 等 . 

四 、 概率 分 布 的 刻画 . 利用 统计 量 内 有 的 性 质 来 刻画 (characterize) 概 率 分 布 ， 
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Ath AE TE CLinnik) , FAS (Kagan) AEA RRB VES EE RRA x e 
人 做 出 的 .他 们 合 著 了 一 本 书 ， 叫做 《数理 统计 学 中 的 刻 加 问题》. 

五 、 和 矩阵 代数 . 线性 模型 中 经 常 要 用 到 投影 运算 以 及 计算 方差 - 协 方差 矩阵 
的 逆 垂 阵 ， 当 矩阵 奇异 时 则 不 可 能 用 传统 的 方法 计算 . 为 此 , 劳 引 进 了 广义 送 的 

A, 并 从 而 使 得 投影 算 千 有 了 明显 表达 式 ,在 线性 模型 中 已 被 广泛 采用 . 

六 、 组 合 分 析 . 为 了 多 因子 试验 的 需要 ,和 劳 提 出 了 被 称 作 正 交 数组 的 组 合 排 
列 方法 ,这 个 方法 变 成 了 编码 (coding) 理 论 中 的 -个 重要 方法 . 

七 、 统 计 学 中 的 微分 几何 方法 .前 而 已 搓 到 劳 是 这 一 领域 中 的 先驱 . 

和 劳 除了 他 在 学 术 上 的 贡献 以 外 , 怨 对 直 界 统计 学 的 发 展 起 到 了 重大 的 推动 作 
用 ,他 的 是 迹 几 乎 遍布 世界 上 所 有 的 国 察 . 他 尤其 关心 发 展 中 国家 ( 即 所 谓 的 第 二 
世界 ) 的 统计 学 的 发 展 ,他 参与 创立 了 第 二 世界 各 学院, 他 是 创建 院士 (tounding 
fellow) 之 一. 

SET , 现在 再 来 介绍 一 下 《统计 与 真理 一 一 怎样 运用 侦 然 性 》 这 本 书 . 

1987 年 是 印度 神奇 数学 家 拉 蝶 纽 扬 的 百年 省 展 纪念 .为 了 纪念 拉 氏 ,印度 组 
织 了 一 系列 演进 , 劳 应 邀 主持 一 个 系列 , 作 了 三 次 演讲 . 林 书 就 是 依 其 讲稿 发 展 
而 成 的 . 

《统计 与 真理 一 一 怎样 运用 偶然 性 》) 呈 其 英文 版 的 书 名 ,在 准备 出 第 二 版 和 中 
文 版 时 ,作者 原 所 改名 为 《统计 变化 尤 常 的 学 问 与 建立 新 知识 》(Uncertainly 
Statistics and Creation of New Knowledge) ,但 从 中 文 的 角度 看 ,其 第 一 个 书 名 更 为 
合适 , 故 笔者 建议 中 文本 仍 采 用 原 书 名 ,作者 采纳 了 笔者 的 意见 . 

《统计 与 真理 一 一 怎样 运用 偶然 性 》 是 一 本 关于 统计 学 原理 的 通俗 的 普及 教科 
书 ,也 是 AAR ERS ee ON EST 对 此 , 笔者 将 给 以 逐 
次 的 分 析 和 解释 . 

全 书 共 分 6 章 36 节 76 小 节 . 每 一 小 节 都 包括 一 个 或 儿 个 例子 .这 些 例子 在 国 
计 民 生 中 处 处 可 见 , 人 人 都 私 , 这 些 例子 不 经 分 析 , 人 们 也 许 不 觉得 有 什么 问题 
一 经 分 析 , 却 发 现存 在 着 深 刘 的 问题 .例如 ,印度 为 了 增加 粮食 咎 产 , 需要 增加 化 
肥 生 产 , 为 了 增加 化 肥 生产 证 要 生产 机 械 ， 从 市 需 贤 增加 钢铁 的 后 产 .为 此 且 的 ， 
他 们 决定 了 增加 钢铁 生产 的 方案 . 这 些 计 划 是 按 当 时 的 生产 实际 需要 制定 的 , 可 
是 当 钢 铁 厂 建成 生产 以 后 , 马上 就 发 现 他 们 的 生产 方案 已 不 适应 已 发 展 了 的 经 济 
现状 的 需要 .这 个 例子 生动 地 描述 了 统计 学 原理 中 贰 测 理论 在 指导 生产 发 展 规划 
中 的 重要 性 .还 有 一 个 关 十 盐 份 的 例子 .印度 政府 为 了 救援 类 军 控制 区 的 难民 , 委 
托 商人 发 放 救 援 物资 , 然后 由 商人 按 他 们 自己 的 账单 到 政府 去 报销 .政府 方 商 如 
何 核 对 这 份 账单 是 否 履 实 呢 ? 这 表 笨 看 来 是 个 难题 ,因为 政府 没有 办 法 去 难民 那 
里 核实 .于 是 委托 统计 尝 家 进行 这 项 工作 .统计 学 家 根据 各 种 物资 之 问 的 比例 关系 
发 现 了 问题 .因为 由 食盐 数量 可 以 估计 难民 的 数量 , 由 难民 的 数量 可 以 估计 救援 
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物资 的 数量 . 因为 食盐 是 最 使 宜 的 物质 , 商人 们 不 太 会 在 这 方面 造假 . 统计 学 家 发 
现 商 人 们 在 许多 贵重 物资 上 报 了 假 账 ,从 而 给 政府 节省 了 大 量 的 资金 . 这 个 例子 
生动 地 描述 了 数理 统计 学 的 估计 原理 及 相关 分 析 是 如 何 被 用 来 解决 一 个 表面 看 来 
无 法 解决 的 问题 . 
由 于 这 些 例子 非常 常见 ， 人 人 都 懂 ， 所 以 读者 不 必 具 备 高 深 的 统计 学 知识 ， 
就 可 以 读 懂 这 本 书 . 读 了 这 本 书 , 读者 就 会 相信 统计 方法 在 国计民生 中 是 如 何 的 
重要 .所 以 ,可 以 说 统计 与 真理 ?是 一 本 通俗 的 统计 原理 的 普及 教科 书 - 
《统计 与 真理 一 一 怎样 运用 倘 然 性 》 也 是 一 本 高 深 的 哲学 善 作 . 作 者 站 在 哲学 
的 角度 看 待 统计 学 不 理 . 长 期 以 来 人 们 对 世界 的 认识 项 固 地 存在 着 岗 分 法 的 概念 ， 
即 不 为 真理 ， 则 必 为 缪 误 . 而 统计 学 的 推断 , 不 能 给 我 们 - -个 肯定 的 回答 . 因此， 
长 期 以 来 , 统计 学 不 被 认为 是 一 门 科学 .这 实际 上 是 一 种 严重 的 洪 解 .通过 实例 ， 
作者 对 此 给 予 了 深刻 的 分 析 , 证 明了 统计 学 是 一 门 最 严格 , 最 合理 的 认识 沦 , 方 
法 论 .举例 而 言 , 在 同样 的 假设 下 , 任何 数学 家 都 应 该 推导 出 同样 的 结论 ,如 果 结 
论 不 同 , 则 至 少 有 一 个 数学 家 的 推导 是 不 正确 的 ,这 就 是 数学 , 而 统计 学 则 木然 ， 
在 同样 的 统计 模型 的 假定 下 , 不 同 的 统计 学 家 可 以 得 到 截然 相反 的 统计 推断 . 一 
是 他 们 可 能 依据 了 各 自 采 集 的 样本 ,即使 在 同 - -组 样本 下 ,由 于 他 们 应 用 了 不 同 
的 统计 方法 ,也 可 能 得 到 完全 相反 的 结论 .这 是 个 说 明 统 计 学 是 … 种 靠不住 的 方 
法 呢 ? 本 书 作 者 ， 从 哲学 的 高 度 回 答 了 这 个 问题 ,问题 归结 为 传统 的 用 两 分 法 回 
答 问 题 的 方式 是 否 合理 . 例如, VERUS TRI, 答案 只 有 两 个 , RA FI, E47 
下 雨 ,表面 看 来 是 这 样 一 个 问题 , 可 是 ,作为 天 气 预 报 ， 远 远 不 是 那么 简单 . 明 大 
可 能 在 某 地 下 雨 ， 其 他 地 方 不 下 两, 明天 可 能 有 时 下 两 , 有 时 不 下 两 ,你 让 气象 
预报 如 何 回答 这 个 问题 呢 ? 再 其 次 , 无 论 你 把 问题 局 限 色 如 何 狭 窑 的 程度 ， 都 不 
能 做 到 百分之百 正确 地 预报 .真正 实际 的 天 气 预报 总 是 容许 一 定 的 错误 的 .所 以 今 
天 的 天 气 预 报 都 是 以 下 两 的 概率 来 预报 的 . 
作者 在 书 中 还 举 出 了 许多 的 例子 米 说 明 人 们 对 于 捉 物 的 认识 是 如 何 地 由 经 验 
到 理性 的 ， 这 就 是 所 谓 的 归纳 法 (induetion) , 3 f AK ( Mendel) 首 先 发 现 了 后 代 的 
比率 而 创造 了 显 性 ,让 忻 基因 的 理论 . 只 是 由 于 以 后 的 试验 ,每 次 都 可 能 产生 错误 
推断 , 反 反 复 复 的 试验 过 程 的 证 明 , 备 氏 理论 才 为 人 们 所 接受 .如 果 一 开始 就 不 
容许 统计 有 任何 错误 , 科学 就 不 可 能 发 展 . 
《统计 与 真理 一 一 怎样 运用 侦 然 性 》 一 包 对 于 高 级 统计 学 研究 人 员 也 具有 深远 
的 意义 . 它 通过 许多 实例 ,深刻 地 揭示 了 现代 统计 学 发 展 的 过 程 ， 特别 是 那些 很 深 
刻 的 理论 是 如 何 从 一 些 非常 实际 的 问题 发 展 起 来 的 . 本 书 可 以 说 是 作者 毕生 经 验 
的 总 结 , 使 人 读 之 , 爱不释手 .特别 , 书 中 也 对 今后 统计 学 的 发 展 做 了 极 具 有 远见 
的 预测 ,笔者 赎 了 此 书 , 深 得 神 益 . 
笔者 希望 《统计 与 真理 一 一 怎样 运用 偶然 性 》 中 文 版 的 出 版 , 能 对 祖国 统计 学 
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的 发 展 发 挥 一 定 的 和 作用, 能 响起 青年 有 热爱 统计 学 ,能 促进 各行 各 业 用 统计 方法 
改进 他 们 的 事业 ， 
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